# SIN.06023 L'Apprentissage Automatique

### Semestre de printemps 2025

### Matthew Vowels
(PhD Eng., PhD Appl. Math, MS, MSc, BMus (hons))

Slides available at www.github.com/matthewvowels1/SIN06023

<img src="logo.png" alt="drawing" width="600" align="left"/>

### Calendrier des cours

Semaine 1: Revue des concepts clés de l'algèbre linéaire, de la théorie des probabilités et de l'optimisation

Semaine 2: Algorithmes d'apprentissage, capacité et biais-variance, et 'maximum likelihood estimation'

Semaine 3: Répartition et validation train/test, k-fold, optimisation des hyperparamètres

Semaine 4: Apprentissage supervisé et non-supervisé

Semaine 5: Machines vectorielles de support

Semaine 6: Arbres de décision et forêts aléatoires

Semaine 7: Réseaux de neurone: Rétropropagation, règle de chaîne et optimisation stochastique

Semaine 8: Réseaux de neurones

Semaine 9: Réseaux convolutifs

**Semaine 10: Biais et équité dans l'apprentissage automatique**

Semaine 11: Apprentissage automatique explicable (importances, SHAP, LIME) et calibration

Semaine 12 : Récapitulation

# Semaine 10: Biais et équité dans l'apprentissage automatique





**Comme toujours, vous devez accéder au contenu du notebook Jupyter depuis le référentiel et l'ouvrir dans Google Colab (ou localement si vous le souhaitez).**

### Resources


Solon Barocas, Moritz Hardt, Arvind Narayanan. Fairness and Machine Learning: Limitations and Opportunities
https://fairmlbook.org

Meredith Broussard. Artificial Unintelligence: How Computers Misunderstand the World

Virginia Eubanks. Automating Inequality: How High-Tech Tools Profile, Police, and Punish the Poor.

Keynotes/Tutoriels par Joy Boulamwini, Kate Crawford, Meredith Whitaker et d'autres.


Le contenu de cette conférence a été inspiré par le discours de Moritz Hardt sur l'équité ici :
https://www.youtube.com/watch?v=Igq_S_7IfOU 


### Citation motivante

*'...The employment of new technologies that reflect and reproduce existing inequities but that are promoted and perceived as more objective or progressive than the discriminatory systems of a previous era.'* 

**Ruha Benjamin**

*'... L'emploi de nouvelles technologies qui reflètent et reproduisent les inégalités existantes mais qui sont promues et perçues comme plus objectives ou progressistes que les systèmes discriminatoires d'une époque précédente.'*  

<img src="bias1.png" alt="drawing" width="900" align="center"/>

<img src="bias2.png" alt="drawing" width="900" align="center"/>

<img src="bias3.png" alt="drawing" width="900" align="center"/>

<img src="bias4.png" alt="drawing" width="900" align="center"/>

La loi essaie de suivre les progrès...

- Règlement général sur la protection des données (RGPD) : article 22 : accorde aux individus le droit de ne pas être soumis à des décisions basées uniquement sur une prise de décision automatisée, ce qui implique un besoin de transparence et d'explicabilité.

- Il existe une interprétation du « droit à l’explication »

- La loi évolue et évolue en réponse aux éventuels problèmes exacerbés par l’IA et l'apprentissage automatique.

### Qu'est-ce qu'un algorithme **équitable** ?


### Comme nous le verrons, la notion d’équité dépend du contexte et de la perspective éthique adoptée.


### Nous voulons éviter les algorithmes qui augmentent ou perpétuent la discrimination et les inégalités.



### Alors, qu’est-ce qu’une *discrimination injustifiée* dans l’apprentissage automatique ?

Deux types :

- Non-pertinence pratique (orientation sexuelle dans les décisions d'emploi ou les recommandations d'emploi)

- Non-pertinence morale – plus compliquée (statut de handicap ou grossesse dans les décisions d'embauche et impact, par exemple, sur le coût pour l'employeur)

Notez également qu'il existe diverses fonctionnalités sensibles (aux États-Unis par exemple, ce sont des classes protégées) :

- Race
- Genre
- Grossesse
- Religion
- Statut familial

Anciennes cartes « ligne rouge » permettant aux agents de prêt de décider où prêter et où ne pas prêter - ce n'est plus légal aux États-Unis

<img src="redline.png" alt="drawing" width="800" align="center"/>
https://www.youtube.com/watch?v=Igq_S_7IfOU Moritz Hardt

Concevez un système capable d'évaluer s'il vaut la peine de livrer le jour même dans une région particulière ou non.




$${f}: \mathbf{X} \rightarrow y$$



<img src="prediction_task.png" alt="drawing" width="900" align="center"/>

#### Exemple du monde réel...

Couverture de livraison Amazon le jour même

<img src="amazonMap.png" alt="drawing" width="1000" align="center"/>
https://www.bloomberg.com/graphics/2016-amazon-same-day/

###  L’utilisation (peut-être bien intentionnée) des algorithmes sans prise de conscience des problèmes conduit à des problèmes d’iniquité.


Des questions:

(1) Est-il préférable de supprimer la variable race du problème de prédiction

(2) Plus largement, ne devrait-on jamais considérer la race comme une variable ?


<img src="prediction_task_mod.png" alt="drawing" width="900" align="center"/>


la race est codée dans les autres variables (une variable latente), peut-être via des mécanismes sociétaux inéquitables que nous ne voulons pas perpétuer


Donc l'option (1) ne fonctionnera pas...



<img src="prediction_task_latent.png" alt="drawing" width="900" align="center"/>

De plus, si nous ne collectons pas la race, nous n’avons aucune possibilité d’évaluer si notre modèle prend indirectement des décisions en l’utilisant.



<img src="prediction_task_latent.png" alt="drawing" width="900" align="center"/>

#### Donc « Nous n’utilisons pas cette variable » n’est pas un argument.

### In english one might say 'there is no fairness without awareness'

### Alors, comment pouvons-nous évaluer et tester l’équité ?

- Critères d'équité dans la classification

- Modélisation causale et explicabilité  (la semaine prochaine)


## Les deux critères populaires

- Taux positif égal:  un nombre égal de cas « acceptés » dans tous les groupes
- Égalisation des taux d’erreur: nombre de faux positifs et de négatifs égal dans tous les groupes

### 1 **Taux positif égal**

Pour le decision $\hat{Y}$, l'appartenance au groupe $G$:


$$p(\hat{Y}=1 | G=a) = p(\hat{Y}=1 | G=b)$$

i.e. s'assurer que le taux d'acceptation est égal dans tous les groupes, et donc que $\hat{Y} \perp\!\!\!\!\perp G $

Ex.: Zemel et al. (2015) https://proceedings.mlr.press/v28/zemel13.html

In [None]:
import numpy as np
from typing import Dict, Tuple


def calculate_equal_positive_rate(predictions: np.ndarray, groups: np.ndarray) -> Dict[str, float]:
    """
    Evaluate the equal positive rate criterion for a decision classifier,
    considering only the group membership.

    :param predictions: A NumPy array containing binary predictions from the classifier.
    :param groups: A NumPy array indicating the group membership of each prediction.
    :return: A dictionary with the positive rate for each group.
    """
    unique_groups = np.unique(groups)
    positive_rates: Dict[str, float] = {}

    for group in unique_groups:
        # Mask for the current group
        mask = (groups == group)

        # Calculate positive rate for the group
        positive_rate = predictions[mask].mean()
        positive_rates[group] = positive_rate

    return positive_rates


In [None]:
np.random.seed(0)

N = 100

# Générer quelques exemples de données
y_true = np.random.randint(0, 2, size=N)

groups = np.random.choice(['A', 'B'], size=N)
print('Example group assignment:',groups[:5])

y_pred = np.random.randint(0, 2, size=N)  #  Au lieu de cela, écoutez vos prédictions réelles
print('Example predictions:', predictions[:5])

result = calculate_equal_positive_rate(y_pred, groups)  # nous n'utilisons pas les vraies étiquettes
print('Per-group positive rate:', result)

### 1 **Taux positif égal** : faiblesses !


On peut avoir un nombre élevé de vrais positifs dans un groupe et un nombre élevé de faux positifs dans un autre, et remplir le critère de taux de positivité égale.

Il existe des solutions dégénérées qui satisfont au critère.

### 2 **Égalisation des taux d’erreur**


Assurer un taux de faux positifs égal:

$$p(\hat{Y}=1|Y=0, G=a) = p(\hat{Y}=1|Y=0, G=b)$$


et garantir un taux de faux négatifs égal:

$$p(\hat{Y}=0|Y=1, G=a) = p(\hat{Y}=0|Y=1, G=b)$$

et donc que $\hat{Y} \perp\!\!\!\!\perp G | Y $

In [None]:
def calculate_false_rates(y_true: np.ndarray, y_pred: np.ndarray, groups: np.ndarray) -> Tuple[Dict[str, float], Dict[str, float]]:

    """
    Calculate the false positive and false negative rates for each group.

    :param y_true: A NumPy array containing the true labels.
    :param y_pred: A NumPy array containing the predicted labels.
    :param groups: A NumPy array indicating the group membership of each label.
    :return: A dictionary with the false positive and false negative rates for each group.
    """
    unique_groups = np.unique(groups)
    fp_rates: Dict[str, float] = {}
    fn_rates: Dict[str, float] = {}

    for group in unique_groups:
        mask = (groups == group)

        # False positives: where true label is 0 but predicted label is 1
        false_positives = np.sum((y_true[mask] == 0) & (y_pred[mask] == 1))

        # False negatives: where true label is 1 but predicted label is 0
        false_negatives = np.sum((y_true[mask] == 1) & (y_pred[mask] == 0))

        # Total negatives and positives 
        total_negatives = np.sum(y_true[mask] == 0)
        total_positives = np.sum(y_true[mask] == 1)

        fp_rate = false_positives / total_negatives if total_negatives > 0 else 0
        fn_rate = false_negatives / total_positives if total_positives > 0 else 0

        fp_rates[group] = fp_rate
        fn_rates[group] = fn_rate

    return fp_rates, fn_rates

In [None]:
fp_rates, fn_rates = calculate_false_rates(y_true, y_pred, groups)
print('False positive rates:', fp_rates)
print('False negative rates:', fn_rates)

### 2 **Égalisation des taux d’erreur** : faiblesses !

Ce critère ne peut être évalué qu'<après> avoir les vraies données - c'est un critère 'post-hoc'. 

Une telle évaluation peut arriver « trop tard ».


Parfois, nous ne pouvons jamais l'évaluer... (par exemple, l'embauche)


Cela ne nous aide pas non plus à éviter les solutions dégénérées...

### 3 **Calibration** 

Pour une fonction de score $R(\mathbf{X})$ qui pourrait simplement être une estimation de $\mathbb{E}[Y|\mathbf{X}]$, un score $R$ est calibré si :

$$p(Y=1 | R=r) = r$$

Nous pouvons calibrer par groupe :

$$p(Y=y | R=r, G=a) = r$$

Nous voulons donc que notre score se comporte comme une probabilité au sein de chaque groupe et signifie donc ce qu'il est censé signifier.

Cela découle de $Y \perp\!\!\!\!\perp G | R$.

### 3 **Calibration** 

En mots : si mon objectif est de prédire $Y$, après avoir observé le score $R$ il n'est pas nécessaire de connaître l'appartenance au groupe. Un r = 0,8 signifie 0,8 quel que soit le groupe.

Si un modèle est calibré, cela signifie que le score reflète fidèlement la probabilité du véritable résultat $Y$, quelle que soit l'appartenance au groupe $G=a$ ou $G=b$ ou autre. Il garantit la fiabilité et la « fiabilité » du classificateur entre les groupes.

Par exemple. r = 0,8 signifie un taux d'insuffisance cardiaque de 80 % en moyenne par rapport aux personnes qui reçoivent un score de 0,8 - leur appartenance à un groupe ne change rien à cela.

In [None]:
# Code... à voir la semaine prochaine 'Platt scaling'!

### 3 **Calibration** : faiblesses !

Cela ne change rien à la pérennisation des inégalités liées aux coûts réels (par exemple grossesses ou handicaps de productivité). 

Calibration ne résout pas le problème de pertinence morale dont nous avons parlé.

### Faiblesses des deux

Ils sont incompatibles!

Exemple simple...

On peut utiliser ces critères pour détecter des problèmes, mais ils ne vous indiquent pas quelle devrait être la solution. En effet, ils sont également tous deux incompatibles !


<img src="incompatibility.png" alt="drawing" width="900" align="center"/>

Changez le contexte mais gardez les chiffres les mêmes...

<img src="employment.png" alt="drawing" width="900" align="center"/>

**Il n’existe pas de solution universelle au problème.** 

Le choix du critère dépend de la situation spécifique, et ils sont incompatibles!

Autres avertissements :

Le respect des critères d'équité à l'aide de l'apprentissage automatique peut souvent conduire à des « solutions paresseuses » et à des problèmes d'équité des **sous**groupes. 

<img src="subgroup.png" alt="drawing" width="300" align="center"/>

### Des solutions globales nécessitaient une compréhension détaillée des problèmes sociétaux, moraux et équitables sous-jacents liés au domaine.

### Par conséquent, les ingénieurs devraient s'adresser à des experts du domaine !

**Considérez** « Défaut de comparaître devant le tribunal ».

**Une approche en cours de promotion** : prédire l'absence de comparution et de détention si le risque est élevé (cela peut durer longtemps - cela est dévastateur pour les familles et le soutien social, et coûteux).

**Alternative** : mettre en œuvre des mesures pour atténuer les problèmes. Reconnaître que les personnes ne se présentent pas au tribunal en raison de problèmes de transport, du manque de services de garde d'enfants, d'horaires de travail ou d'un trop grand nombre de rendez-vous au tribunal.

Une solution d’apprentissage automatique peut chercher à réduire les coûts mais en fin de compte faire le contraire.

## Résumé

Les préjugés et l'équité sont un sujet important dans l'apprentissage automatique, et la loi s'adapte rapidement en réponse à la mise en œuvre généralisée de processus décisionnels automatisés.

Les algorithmes débiaisés/équitables sont difficiles à concevoir, et même leur définition est difficile, nécessitant des connaissances spécialisées dans le domaine et la prise en compte de principes pratiques, éthiques et moraux.


Enfin, nous sommes limités par notre accès uniquement à la distribution conjointe $p(X, Y, G...)$. L’inférence causale est une option pour explorer statistiquement ces problèmes plus profonds. Il existe un fossé sémantique difficle à combler.

### La semaine prochaine:

- Comment calibrer votre algorithme
- Explicabilité de l'apprentissage automatique et perspective causale

In [4]:
from IPython.display import Image, display

def finished_lecture(condition: int = 0, thank_you_image_url: str = None):
    # Check if the input is an integer and either 0 or 1
    if not isinstance(condition, int) or condition not in [0, 1]:
        raise ValueError("condition must be an integer and either 0 or 1")

    if condition == 1:
        print('Merci et je serai heureux de répondre à vos questions !')
        if thank_you_image_url:
            display(Image(url=thank_you_image_url))
    elif condition == 0:
        return
    
    
condition = 1

finished_lecture(condition=condition)

Merci et je serai heureux de répondre à vos questions !
