
# Transfert d'organe sous incertitude sur la compatibilité

Sibyline Moukarzel, Matthieu Roux

<span style="color:  #FF0000"> **Documentation de base sur les graphes en Julia : https://juliagraphs.org/Graphs.jl/dev/first_steps/access/** </span>

## Introduction à rendre le 27 janvier

Malgré l'augmentation croissante du nombre de transplantations d'organes effectuées chaque année (environ 6000 en 2017 dont 3782 transplantations de reins), la demande reste en perpétuelle augmentation. Ainsi 6000 organes, dont 3782 reins, ont été transplantés en 2017, mais il y avait encore 24000 personnes en attente d'un organe la même année. Les organes transplantés peuvent provenir d'un donneur décédé ou, dans le cas des reins et du foie, d'un donneur vivant consentant, le plus souvent membre de la famille du patient. Hélas, même si un proche accepte de prendre ce risque pour sa santé, il ne sera pas forcément compatible avec le patient. Pour cette raison, les pratiques médicales les législations évoluent dans de nombreux pays afin de permettre la mise en place d'un programme d'échange de dons d'organes.

L'exemple le plus simple d'échange de don d'organes est celui où deux patients $P_1$ et $P_2$ sont accompagnés de donneurs $D_1$ et $D_2$. Les patients sont supposés incompatibles avec les donneurs qui les accompagnent, mais on suppose que $D_1$ est compatible avec $P_2$ et $D_2$ avec $P_1$. Il est alors possible de transplanter un organe de $D_1$ vers $P_2$ et de $D_2$ vers $P_1$ avec le consentement de tous et en suivant la procédure légale.

Plus généralement, un cycle d'échange d'organes associe $k$ paires de patient-donneur $(P_{i_1},D_{i_1}), \dots, (P_{i_k},D_{i_k})$ de sorte que $D_{i_l}$ donne à $P_{i_{l+1}}$ pour $l=1,\dots,k-1$ et $D_{i_k}$ donne à $P_{i_1}$.
Par ailleurs, le point essentiel est que les transferts soient tous réalisés en même temps et dans le même hôpital pour éviter qu'une rétractation de dernière minute ne lèse un patient et son donneur, et que les patients et donneurs venus ensemble et leur famille puissent se soutenir émotionnellement durant l'hospitalisation. 
Pour cette raison, le nombre d'échanges prenant place au sein d'un même cycle est nécessairement limité. En pratique, l'organisation d'un cycle de trois paires est déjà une épreuve pour le personnel d'un hôpital, et le plus grand cycle ayant jamais eu lieu a a impliqué six patients et donneurs.

Dans ce projet, nous prendrons le point de vue de l'organisme national responsable de la gestion du programme d'échange d'organes. 
À chaque phase d'échange, l'objectif de cet organisme est de choisir un ensemble de cycles d'échanges entre paires compatibles afin de maximiser le nombre de patients recevant un organe. Dans certains cas, on peut aussi donner une priorité à certains patients en fonction de la gravité de leur état ou de la durée de leur attente. 
Pour cela, on pourra attribuer des poids différents à chaque patient et maximiser la somme des poids des patients recevant un organe. 

Lors d'une première phase de planification, l'organisme ne dispose que de données individuelles sur chaque donneur et chaque receveur pour déduire la compatibilité entre donneurs et patients. 
Ces données sont principalement le groupe sanguin et le complexe majeur d’histocompatibilité, aussi appelé système HLA. 
Ils en tirent un premier graphe de compatibilité orienté, $G=(V,A)$, où chaque sommet de $V$ représente une paire donneur-patient et où un arc entre deux paires $(P_k,D_k)$ et $(P_l,D_l)$ signifie que $D_k$ est __a priori__ compatible avec $P_l$.
Cependant, la compatibilité effective entre deux personnes ne peut être assurée qu'en mettant en présence des tissus des deux personnes dans ce que l'on appelle un _test croisé_. 
En général, on peut supposer que les données individuelles permettent de déterminer une probabilité de réussite du test croisé.
Mais, dans tous les cas, ces tests peuvent être lourds à réaliser pour les patients et demander des ressources importantes aupèrs des services hospitaliers, donc leur nombre sera toujours limité. 
On pourra pour cela considérer une limite fixe, une limite dépendant du nombre de paires patient-donneur ou bien supposer que les tests ne servent qu'à confirmer la compatibilité après avoir décidé les cycles d'échange entre patients a priori compatibles. 

## Description des données

Des jeux de données correspondant à des ensembles de paires patient-donneur ont été partagés dans la PrefLib (https://www.preflib.org/data/MD). Le sous-ensemble d'instances auxquels vous pourrez vous intéresser dans un premier temps accompagne ce sujet sur Moodle. Les dix premières instances (numérotées de 1 à 10) contiennent 10 paires patient-donneur, les 10 suivantes (numérotées de 31 à 40) en contiennent 32 et les 10 dernières (numérotées de 71 à 80) en contiennent 64. Chaque jeu de données est décrit par deux fichiers, l'un énumérant les données relatives à chaque paire et portant l'extension .dat, et l'autre énumérant les données relatives aux arcs et portant l'extension .wmd.
Nous vous fournissons une fonction permettant de lire les fichiers relatifs à un jeu de donnéees. 

Idées : 

    - Tester avec 32 et 64, analyser les résultats avec différentes distributions, quels sont les patients soignés ? Le temps de calcul ?
    - Imposer une contrainte où un patient soit être pris absolument
    - 

In [1]:
# include all the necessary packages, if some of them are not installed, you will need to install them before
using Random, MetaGraphs, SimpleWeightedGraphs,JuMP, DelimitedFiles, Distributions, NBInclude, GLPK, Gurobi, GraphPlot, Graphs

┌ Info: Precompiling Gurobi [2e9cd046-0924-5485-92f1-d5272153d98b]
└ @ Base loading.jl:1664
[91m[1mERROR: [22m[39mLoadError: SystemError: opening file "C:\\Users\\sibyl\\.julia\\packages\\Gurobi\\xvBAY\\deps\\deps.jl": No such file or directory
Stacktrace:
  [1] [0m[1msystemerror[22m[0m[1m([22m[90mp[39m::[0mString, [90merrno[39m::[0mInt32; [90mextrainfo[39m::[0mNothing[0m[1m)[22m
[90m    @ [39m[90mBase[39m [90m.\[39m[90m[4merror.jl:176[24m[39m
  [2] [0m[1m#systemerror#80[22m
[90m    @ [39m[90m.\[39m[90m[4merror.jl:175[24m[39m[90m [inlined][39m
  [3] [0m[1msystemerror[22m
[90m    @ [39m[90m.\[39m[90m[4merror.jl:175[24m[39m[90m [inlined][39m
  [4] [0m[1mopen[22m[0m[1m([22m[90mfname[39m::[0mString; [90mlock[39m::[0mBool, [90mread[39m::[0mNothing, [90mwrite[39m::[0mNothing, [90mcreate[39m::[0mNothing, [90mtruncate[39m::[0mNothing, [90mappend[39m::[0mNothing[0m[1m)[22m
[90m    @ [39m[90mBase[39m [90

LoadError: Failed to precompile Gurobi [2e9cd046-0924-5485-92f1-d5272153d98b] to C:\Users\sibyl\.julia\compiled\v1.8\Gurobi\jl_D729.tmp.

In [2]:
# Inclusion du fichier contenant la fonction de parsing des données
@nbinclude("dataparser.ipynb")
# Exemple d'utilisation de la fonction supposant que les fichiers sont dans le dossier data
#matthieu_path = "C:/Users/matth/Documents/5GM/optim sous incertitude/stochastic_optimization/data/"
sibyline_path = "C:/Users/Sibyline Moukarzel/Documents/Ecole/INSA - Sciences Po/INSA/5MA/Optimisation sous incertitude/Projet/data/" 

kep_graph = read_kep_file(sibyline_path*"MD-00001-00000001.wmd", sibyline_path*"MD-00001-00000001.dat");
#kep_graph = read_kep_file(matthieu_path*"MD-00001-00000001.wmd", matthieu_path*"MD-00001-00000001.dat");

LoadError: ArgumentError: C:/Users/Sibyline Moukarzel/Documents/Ecole/INSA - Sciences Po/INSA/5MA/Optimisation sous incertitude/Projet/data/MD-00001-00000001.wmd: file not found.

Une fois le graphe de compatibilité donné, une instance est entièrement décrite par la connaissance de la distribution des incertitudes dans une approche par optimisation stochastique. Dans une approche par optimisation robuste, le pire cas est déjà connu pour chaque arête, il s'agit d'un échec de la transplantation. Plusieurs modèles d'incertitudes sont classiquement regardés dans la littérature, mais tous considèrent que la réussite du test croisé réalisé sur un arc $a$ suit une loi de Bernouilli de probabilité $1-f_a$ où $f_a$ est une probabilité d'échec donnée. Nous donnons ci-dessous la fonction permettant de calculer des probabilités d'échec pour tous les arcs en fonction d'un paramètre à choisir dans le tableau DISTRIBUTIONS.

In [3]:
DISTRIBUTIONS = ["Constant","Binomial","BinomialUNOS","BinomialAPD","NoFailure"]

"""
    get_failure_rates

Generate failure rates on each edge, and add its value as a property to the edge of the kep_graph. 

# Parameters
* `kep_graph::MetaDiGraph` : graph describing the pairs and compatibilities
* `distribution::String` : type of distirbution of uncertainties; to be chosen in the DISTRIBUTIONS vector
"""
function get_failure_rates(kep_graph::MetaDiGraph, distribution::String)

    failure_rates = []

    for edge in MetaGraphs.edges(kep_graph)
        # Failure rates depend on the chosen distribution of uncertainties
        if distribution == "Constant"
            # constant failure rates equal to 70%
            set_prop!(kep_graph, edge, :failure, 0.7)
        elseif distribution == "Binomial"
            if rand() < 0.25
                # random failure rates equal to 10% on average for 25% edges
                set_prop!(kep_graph, edge, :failure, rand() * 0.2)
            else
                # random failure rates equal to 90% on average for 75% edges
                set_prop!(kep_graph, edge, :failure, 0.8 + rand() * 0.2)
            end
        elseif distribution == "BinomialUNOS"
            # %pra denotes the panel reactive antibody level
            # %pra of the patient < 0.8 : UNOS low sensitized patients
            if get_prop(kep_graph, edge.dst, :pra) < 0.8
                # failure rate equal to 10% if the patient is low sensitized
                set_prop!(kep_graph, edge, :failure, 0.1)
            else
                # failure rate equal to 90% otherwise 
                set_prop!(kep_graph, edge, :failure, 0.9)
            end
        elseif distribution  == "BinomialAPD"
            # %pra denotes the panel reactive antibody level
            # %pra of the patient < 0.75 : APD low sensitized patients
            if get_prop(kep_graph, edge.dst, :pra) < 0.75
                # failure rate equal to 28% if the patient is low sensitized
                set_prop!(kep_graph, edge, :failure, 0.28)
            else
                # failure rate equal to 58% otherwise 
                set_prop!(kep_graph, edge, :failure, 0.58)
            end
        elseif distribution == "NoFailure"
            # failure rates equal to 0
            set_prop!(kep_graph, edge, :failure, 0.)
        end
    end
end


get_failure_rates

In [4]:
failure_rates = get_failure_rates(kep_graph, "Binomial")

LoadError: UndefVarError: kep_graph not defined

In [5]:
print([get_prop(kep_graph,e,:failure) for e in MetaGraphs.edges(kep_graph)])

LoadError: UndefVarError: kep_graph not defined

## Travail à réaliser

Nous vous donnons une grande liberté sur la façon de traiter le sujet. En fonction de décisions que vous justifierez, vous pourrez traiter le problème par une approche d'optimisation stochastique, d'optimisation robuste ou de toute autre approche averse aux risques. Le travail commencera par décrire l'approche suivie puis le modèle en découlant. Un code Julia permettra ensuite d'implémenter une ou plusieurs méthodes de résolution pour le modèle. Vous pourrez tester la ou les méthodes sur des instances de la PrefLib. Vos interprétations devront rendre compte des enjeux pratiques et des enjeux algorithmiques (optimalité, temps de calcul, passage à l'échelle, etc.) de votre travail.
Le résultat de votre travail sera à rendre dans ce notebook avant le 14 janvier 2022. Chaque cellule du notebook aura préalablement été exécutée (sans erreur, évidemment), et il importera que les affichages utilisés dans vos interprétations y apparaissent. 

In [6]:
x = [0, 10, 20, 30, 40, 40, 40, 40, 40, 30, 20, 10, 0, 0, 0, 0]
y = [0, 0, 0, 0, 0, 10, 20, 30, 40, 40, 40, 40, 40, 30, 20, 10]
nodelabel = 1:MetaGraphs.nv(kep_graph)
gplot(kep_graph, nodelabel = nodelabel, x, y)

LoadError: UndefVarError: kep_graph not defined

## Modélisation déterministe sans limite de taille de cycle d'échange
On modélise d'abord notre problème en supposant que la probabilité d'échange pour chaque arc est de 1. On considère également qu'il n'y a pas de limite à la taille des cycles d'échanges.

On note $w_{i,j} = 1, ~ \forall (i,j) \in A$, les poids des arcs du graphe.

On considère les variables suivantes :
- $x_{i,j} \in \{1,0\}$, $x_{i,j} = 1$  si le donneur de la paire i donne au patient de la paire j 


Objectif :

maximiser le nombre d'échange : max $\sum_{i,j : (i,j) \in A} x_{ij} w_{ij}$   

Contraintes :

- $\sum_{j : (j,i) \in A} x_{ji} = \sum_{j : (i,j) \in A} x_{ij}$, $\forall i \in V$, (le patient i recoit un rein ssi le donneur i donne un rein)

- $\sum_{j : (i,j) \in A} x_{ij} \le 1$, $\forall i \in V$, ( un donneur peut donner seulement un rein) 

In [7]:
function first_MIP(kep_graph::MetaDiGraph)
    nb_vertices = MetaGraphs.nv(kep_graph)
    #modele = Model(Gurobi.Optimizer)
    modele = Model(GLPK.Optimizer)
    
    # Nombre de paires de donneurs/patients, nombre de noeuds du graphe :
    P = MetaGraphs.nv(kep_graph)
    #N
    compatible = [(i,j) for i in 1:nb_vertices, j in 1:nb_vertices if MetaGraphs.has_edge(kep_graph, i,j)]

   
    # Variable : indique si le patient de la paire j a un rein du donneur de la paire i
    @variable(modele,x[i in 1:P,j in 1:P],Bin)
    
    # Contrainte : le patient i recoit un rein ssi le donneur i donne un rein
    @constraint(modele,recoit[i in 1:P],sum(x[j,i] for j in 1:P if ((j,i) in compatible)) == sum(x[i,j] for j in 1:P if ((i,j) in compatible)))
    # Contrainte : un donneur peut donner seulement un rein
    @constraint(modele,capacite[i in 1:P],sum(x[i,j] for j in 1:P if ((i,j) in compatible))<=1)

    # Contrainte : on veut des cycles plus petits que L
    
    # Objectif : maximiser le nombre total de transplantations
    @objective(modele,Max,sum(x[i,j] for (i,j) in compatible))
    println(modele)
    set_optimizer_attribute(modele, MOI.Silent(), true)
    optimize!(modele)

return JuMP.objective_value(modele), JuMP.value.(x)
end

first_MIP (generic function with 1 method)

In [8]:
obj1, x1 = first_MIP(kep_graph)

LoadError: UndefVarError: kep_graph not defined

In [9]:

plot_x = [0, 10, 20, 30, 40, 40, 40, 40, 40, 30, 20, 10, 0, 0, 0, 0]
plot_y = [0, 0, 0, 0, 0, 10, 20, 30, 40, 40, 40, 40, 40, 30, 20, 10]
nb_vertices = MetaGraphs.nv(kep_graph)
nodelabel = 1:nb_vertices
optimized_graph = MetaDiGraph(nb_vertices, 0)

for i in 1:nb_vertices
    for j in 1:nb_vertices
        if x1[i,j]>0
            MetaGraphs.add_edge!(optimized_graph, i, j, :weight, x1[i,j])
        end 
    end
end
gplot(optimized_graph, nodelabel = nodelabel, plot_x, plot_y)


LoadError: UndefVarError: kep_graph not defined

## Autre formulation déterministe

On prend maintenant une formulation déterministe par cycle. En effet, la contrainte pour laquelle on a trop de chemin n'est pas cool...

## Premier modèle : les probabilité comme données déterministes

Cette modélisation s'appuie sur le constat suivant : si on connait la probabilité de réussite d'une greffe (ou la probabilité d'échouer), on connait la probabilité de réussite d'un cycle.
Soit $p_{ij}$ la probabilité de réussite d'une greffe entre le donneur $D_i$ et le patient $P_j$. Par ailleurs, on peut raisonnablement supposer que les probabilité de réussite des greffes d'un cycle sont indépendantes, puisque les donneurs/patients sont tous différents. On suppose par ailleurs qu'il n'y a pas d'erreur médicale, et que, une probabilité $p_{ij} = 1$ sera forcément une greffe réussie. Dans ce cas, la probabilité de réussite d'un cycle $c = (1, 2, ..., k)$ est données par $p_c = \prod\limits_{i = 1}^{k-1} p_{i, i+1}$, autrement dit, le produit des probabilités du cycle.

On peut donc décider de trouver tous les cycles potentiels dans nos données (en fixant une taille maximale), puis de ne faire les tests croisés que pour les greffes présentes dans ces cycles.

### Trouver les cycles du graphe

On commence par créer une fonction qui liste tous les cycles de taille inférieure ou égale à K dans un graphe G.

In [10]:
function liste_cycles(G::MetaDiGraph, K::Integer)
    paires = [i for i in 1:nv(G)]
    cycles = []
    
    function enumeration(p, c, K)
        for s in neighbors(G, p) #  Successeurs de p
            if s == c[1] # Si c'est le premier sommet du cycle
                append!(cycles, [c])
            elseif s < c[1]
                continue
            elseif s in c
                continue
            elseif length(c) <= K-1
                c_copie = copy(c)
                append!(c_copie, s)
                enumeration(s, c_copie, K)
            end
        end 
    end
    
    for p in paires
       c = [p]
        enumeration(p, copy(c), K)
    end
    
return(cycles)
end

liste_cycles (generic function with 1 method)

Pour avoir tous les cycles d'un graphe, il faut que K soit égal (au minimum) au nombre de sommets sur graphe.Dans la réalité, on ne s'intéressera jamais aux grands cycles puisqu'on ne fait pas beaucoup de greffes en simultané. Comme le plus rand cycle historiquement réalisé est de 6 greffes, on utilisera donc cette valeur pour K. Il semble toutefois raisonnable, selon les cas d'étude, de réduire K à 4 (voire moins) pour des questions de faisabilité médicale.

Par exemple, le graphe `kep_graph` contient 3 cycles, que l'on peut retrouver ci-dessous.

In [11]:
println(liste_cycles(kep_graph, 18))

LoadError: UndefVarError: kep_graph not defined

In [12]:
L = liste_cycles(kep_graph, 18)

LoadError: UndefVarError: kep_graph not defined

In [13]:
println(vcat(L))

LoadError: UndefVarError: L not defined

In [14]:
function determinist_cycle_MIP(kep_graph::MetaDiGraph, K)
    nb_vertices = MetaGraphs.nv(kep_graph)
    # modele = Model(Gurobi.Optimizer)
    modele = Model(GLPK.Optimizer)
    
    # On cherche les cycles dans le graphe
    cycles = liste_cycles(kep_graph, K)
    weight_cycle = [length(c) for c in cycles]    
    # Variable : indique si le cycle c est sélectionné ou non
    @variable(modele, z[c in 1:length(cycles)], Bin)
    
    # Contrainte : une paire patient/donneur ne peut s'impliquer que dans un cycle au maximum
    @constraint(modele, max_cycle[i in 1:nv(kep_graph)], sum(z[c] for c in 1:length(cycles) if i in cycles[c]) <= 1)
    
    # Objectif : maximiser le nombre total de transplantations
    @objective(modele, Max, sum(weight_cycle[c]*z[c] for c in 1:length(cycles)))
    println(modele)
    set_optimizer_attribute(modele, MOI.Silent(), true)
    optimize!(modele)

return JuMP.objective_value(modele), JuMP.value.(z)
end

determinist_cycle_MIP (generic function with 1 method)

In [15]:
determinist_cycle_MIP(kep_graph,4)

LoadError: UndefVarError: kep_graph not defined

D'après la méthode utilisé sur cette section, on a donc 3 tests croisés à effectuer, malgré le fait qu'il y ait 18 couples patients/donneurs impliqués dans le graphe. Cette méthode permet donc de réduire largement le travail de préparation à faire, en tout cas sur ce premier exemple.

### Calcul de la probabilité de réussite d'un cycle

On va ici définir une fonction `proba_cycle` qui calcule la probabilité de réussite d'un cycle en faisant le produit des probabilités de réussite de chaque greffe impliquée dans le cycle.

<span style="color:  #FF0000">Je ne sais pas comment accéder aux proba d'échec.</span>

In [16]:
function proba_cycle(G, c)  
    proba = 1
    n = size(c)[1]
    for i in 1:(n-1)
        proba = proba*(1 - get_prop(G,Graphs.SimpleGraphs.SimpleEdge(c[i], c[i+1]),:failure))
    end
    proba = proba * get_prop(G,Graphs.SimpleGraphs.SimpleEdge(c[n], c[1]),:failure)
    return proba
end    

proba_cycle (generic function with 1 method)

In [17]:
cycle = liste_cycles(kep_graph,4)[2]
get_failure_rates(kep_graph, "Binomial")
proba_cycle(kep_graph, cycle) 

LoadError: UndefVarError: kep_graph not defined

In [13]:
get_failure_rates(kep_graph, "Constant")
proba_cycle(kep_graph, cycle) 

0.018900000000000007

### Implémentation du modèle

<span style="color:  #FF0000">**A faire plus tard :
Il ne faut pas avoir une approche déterministe mais plutôt probabiliste (donc pas de solveur mais une métjde L-shaped) parce que, là, si un cycle a une proba très faible de réussite mais qu'aucune des paire n'est impliquée dans un autre cycle, il sera choisi. Alors qu'avec une méthode probabilité, on utilisera la moyenne donc on ne voudra pas pondérer par un cycle qui pourrait la faire baisser trop fortement (est-ce que c'est bien vrai ?).**</span>

<span style="color:  #FF0000">
Dans ce cas, chaque choix de cycle arrivera avec une probabilité $p_c$ (les scénarios sont donc les différents cycles), le souci c'est qu'on aurait un modèle qui ne choisirait qu'un seul cycle ??


Remarque : la fonction objectif du modèle ci-dessous est une formule d'espérance

Je sais pas si la contrainte 1 est claire. Il faut peut être voir pour une autre formulation, mais l'idée c'est qu'un x ne peut valoir 1 que si le cycle c est choisi pour faire une greffe, sinon il doit valoir 0.</span>

<span style="color:  #FF0000">**A faire plus tard :
Recoder avec seulement z**</span>
Soit $C(K)$ l'ensemble des cycles du graphe de longueur au plus K. Soit $V$ l'ensemble des sommets (paires patients/donneurs) du graphes.
Soit $p_c$ la probabilité de réussite associée au cycle $c$, pour tout $c \in C(K)$.

**Variables :**

* $z_c$ : vaut 1 si le cycle $c$ est choisi, 0 sinon, pour tout $c \in C$

**Objectif :** On veut maximiser le nombre de cycle en tenant compte de leur probabilité de réussite  
$max \sum \limits_{c \in C} p_c z_c$

**Contraintes :**
* Un sommet appartient au plus à 1 cycle: $\forall i \in I, \sum \limits_{c:i \in V(c)} z_{c} \le 1$

* Binarité et positivité des variables : $\forall c \in C(K) z_c \in \{0, 1\}$
pour le proba de réussite : mettre un seuil.

In [None]:
function prod_MIP(kep_graph::MetaDiGraph, K)
    nb_vertices = MetaGraphs.nv(kep_graph)
    # modele = Model(Gurobi.Optimizer)
    modele = Model(GLPK.Optimizer)
    
    # On cherche les cycles dans le graphe
    cycles = liste_cycles(kep_graph, K)
    
    # On récupère les probabilités de réussite de chaque cycle
    succes = []
    for c in cycles
       append!(succes, proba_cycle(kep_graph, c)) 
    end
  
    # Variable : indique si le cycle c est sélectionné ou non
    @variable(modele, z[c in 1:length(cycles)], Bin)
    
    # Contrainte : une paire patient/donneur ne peut s'impliquer que dans un cycle au maximum
    @constraint(modele, max_cycle[i in 1:nv(kep_graph), sum(x[i,c] for c in 1:length(cycles)) <= 1)
    # Contrainte : Si un cycle est choisi, toutes les paires sont impliquées
    @constraint(modele,implication[c in 1:length(cycles)], z[c] == x[i,c] for i in 1:nv(kep_graph))
    
    # Objectif : maximiser le nombre total de transplantations
    @objective(modele, Max, sum(succes[c]*z[c] for c in 1:length(cycles))
    println(modele)
    set_optimizer_attribute(modele, MOI.Silent(), true)
    optimize!(modele)

return JuMP.objective_value(modele), JuMP.value.(z)
end

## Modèle validé par "El profesor"

__Données__: 
- les scénarios $(\xi_1, \dots, \xi_n)$, chacun représente une combinaison de cycles possibles au sein du graphe
- $p_k$ la probabilité du scénario $\xi_k$
- A, l'ensemble des arcs dans les cycles 
- $l_c$, la longueur du cycle c
- $\gamma_a(\omega) \ a \in A $, les v.a.iid qui valent 1 si le test est valide pour l'arc a avec une probabilité $p_a$

__Variables__ :

1er ordre :

- \begin{equation*}
    \eta_a = 
    \begin{cases} 
    1 \text{ si le test entre (i,j) = a est effectué} \\
    0 \text{ sinon}
   \end{cases}
    \end{equation*}
    
Recours :
- \begin{equation*}
    z^k_c = 
    \begin{cases} 
    1 \text{ si on choisit le cycle c dans le scénario k} \\
    0 \text{ sinon}
   \end{cases}
    \end{equation*}



__Objectif__ : maxmimiser le nombre de personnes sauvées 

$$ max_{z^k_c} \mathbb{E}[ \underset{c}{\Sigma} l_c z^k_c ] = \underset{k}{\Sigma} p_k \ \underset{c}{\Sigma} l_c z^k_c  $$



__Contraintes__ : 

- une personne ne peut donner qu'une seule fois (un sommet appartient au plus à 1 cycle) :  $\forall i \in I, \sum \limits_{c:i \in V(c)} z^k_{c} \le 1$

- le test doit être validé : $\forall c \in C, \ \forall a \in c, \ \forall k, \  \gamma_a \geq z^k_c \ \  $

- Effectuer les tests avant de choisir un cycle : $\forall c, \ \forall a \in c \ \forall k, \  \eta_a \geq z^k_c \ \  $

- limite du nombre de test : $\underset{a\in A}{\Sigma}\eta_a \leq M $


Dans cette formulation, nous avons $2^{|A|}$ scénarios possibles, dans le cas où l'ensemble A est de grande dimmensions, on peut considérer que l'on a un nombre infini de scénarios et donc des distributions de probabilités continues. Dans ce cas, on échantillonera un nombre de scénarios donné. 


#### Résolution du problème avec la méthode L-shaped :

Problème maître initial relaché :

 $$(\mathbb{MPR}):\max \{0: \underset{a\in A}{\Sigma}\eta_a \leq M\}.$$


Sous-problèmes :
$$\begin{equation*}
Q(z^k_c,\xi_k) =  \begin{cases}
	\max \ \underset{c}{\Sigma} l_c z^k_c \\
	\sum \limits_{c:i \in V(c)} z^k_{c} \le 1 \  \forall i \in I, \\
	\gamma_a \geq z^k_c \ \ \ \forall c \in C, \ \forall a \in c, \ \forall k \\
	 \eta_a \geq z^k_c \ \ \ \forall c \in C, \ \forall a \in c,  \ \forall k 
	 \end{cases}
\end{equation*}$$



### Optimisation averse au risque 

Nous voulons sauver le maximum de personnes et chaque donnation doit être validée au préalable par un test croisé.

Il semble naturel de vouloir éviter de faire des tests non concluant. En effet, un test non concluant peut donner de faux espoirs à une personne et entraîne un surcoût.

On peut donc rajouter la contrainte suivante à notre modèle : $\mathbb{P} (z^k_c \ successful) \geq \alpha$: on veut que la probabilité de réussite du cycle c du scénario k doit être supérieur à un certain $\alpha$

Cette perspective peut être intéressante si on ne prend pas en compte taux d'anticorps réactif de panel (PRA). Un anticorps réactif de panel est créé lorsqu'un tissu étranger est introduit dans le corps. Si ce taux d'anticorps est élevé pour un receveur, il sera beaucoup plus difficile de lui faire corespondre un organe donneur (source : https://spiegato.com/fr/quest-ce-quun-anticorps-reactif-de-panel)   

Ainsi, les patients avec un fort PRA ont une probabilité de réussite de greffe plus faible, les cycles contenant ces personnes ont donc  également une probabilité plus faible de réussite. Par conséquent, avec cette contrainte en probabilité, ces patients à fort PRA ont très peu de chance de se retrouver dans un cycle d'échange et sont donc pénalisés.   


Rajouter une contrainte en proba pour sauver les personnes les plus en détresse.

Voir ce qui peut se faire d'un point de vue de la CVaR

In [18]:
function chance_constraint_cycle_MIP(kep_graph::MetaDiGraph, K, alpha)
    nb_vertices = MetaGraphs.nv(kep_graph)
    # modele = Model(Gurobi.Optimizer)
    modele = Model(GLPK.Optimizer)
    
    # On cherche les cycles dans le graphe
    cycles = liste_cycles(kep_graph, K)
      
    succes = [proba_cycle(kep_graph,c) for c in cycles]
    
    # Variable : indique si le cycle c est sélectionné ou non
    @variable(modele, z[c in 1:length(cycles)], Bin)
    
    # Objectif : maximiser le nombre total de transplantations
    @objective(modele, Max, sum(succes[c]*z[c] for c in 1:length(cycles)))

    # Contrainte : une paire patient/donneur ne peut s'impliquer que dans un cycle au maximum
    @constraint(modele, max_cycle[i in 1:nv(kep_graph)], sum(z[c] for c in 1:length(cycles) if i in cycles[c]) <= 1)
    
    println(modele)
    set_optimizer_attribute(modele, MOI.Silent(), true)
    optimize!(modele)

return JuMP.objective_value(modele), JuMP.value.(z)
end

LoadError: syntax: unexpected "]"

In [17]:
chance_constraint_cycle_MIP(kep_graph, 4, 0.01)


Max 0.11463289643964947 z[1] + 0.010007517596818637 z[2] + 0.08155856712979939 z[3]
Subject to
 risk_cons[1] : 0.11463289643964947 z[1] >= 0.01
 risk_cons[2] : 0.010007517596818637 z[2] >= 0.01
 risk_cons[3] : 0.08155856712979939 z[3] >= 0.01
 max_cycle[1] : z[1] + z[2] <= 1.0
 max_cycle[2] : 0 <= 1.0
 max_cycle[3] : z[2] + z[3] <= 1.0
 max_cycle[4] : 0 <= 1.0
 max_cycle[5] : 0 <= 1.0
 max_cycle[6] : z[1] + z[2] <= 1.0
 max_cycle[7] : 0 <= 1.0
 max_cycle[8] : z[2] + z[3] <= 1.0
 max_cycle[9] : 0 <= 1.0
 max_cycle[10] : 0 <= 1.0
 max_cycle[11] : 0 <= 1.0
 max_cycle[12] : 0 <= 1.0
 max_cycle[13] : 0 <= 1.0
 max_cycle[14] : 0 <= 1.0
 max_cycle[15] : 0 <= 1.0
 max_cycle[16] : 0 <= 1.0
 z[1] binary
 z[2] binary
 z[3] binary



LoadError: Result index of attribute MathOptInterface.ObjectiveValue(1) out of bounds. There are currently 0 solution(s) in the model.

## Robuste 

Qu'est ce qu'un pire cas ?

Les gens qui en ont le plus besoin ne sont pas sauvé,

Proba très faible dans les cycles. 




Conclusion : Dans ce modèle, on constate que beaucoup de tests croisés sont à effectuer pour choisir les "meilleurs" cycles à mettre en oeuvre. Il semblerait donc pertinent de trouver une méthode de sélection de certains cycles avant la connaissance de toutes ces probabilités pour réduire le nombre de tests croisés à effectuer.