<h1> Paradoxe de Parrondo </h1>
<h2>Présentation</h2>
Soit $A$ un jeu de pile ou face avec une pièce biaisée (pile avec une probabilité de $p=\frac12-\varepsilon$, face avec une probabilité de $\frac12+\varepsilon$ où $\varepsilon>0$). On lance la pièce. Si on obtient pile, on gagne un jeton (ou un euro); sinon on perd un jeton (ou un euro).

Soit $B$ un jeu avec deux pièces biaisées. La pièce 1 donne pile avec une probabilité $p_1=\frac1{10}-\varepsilon$ et la pièce 2 donne pile avec une probabilité $p_2=\frac34-\varepsilon$. Si le joueur a un capital $K$ (de jetons ou d'euros) qui est un multiple de $m=3$, on lance la pièce 1, sinon on lance la pièce 2.
Comme dans le jeu $A$, si on obtient pile, on gagne un jeton (ou un euro); sinon on perd un jeton (ou un euro).

Soit $AB$ un jeu avec une pièce non biaisée. On lance la pièce. Si on obtient pile, on joue à $A$; sinon on joue à $B$.

On joue aléatoirement, 100 fois, au jeu $A$ ou au jeu $B$. C'est-à-dire qu'avec une pièce non biaisée, on décide - à chaque tour - si on joue à $A$ ou à $B$. 


<h3>Questions</h3>

On prend $\varepsilon=\frac5{1000}$.

On démarre avec un capital $K=0$.

<ol>
<li> Simuler 100 000 fois, l'évolution du capital $K$ d'un joueur qui joue $k$ fois au jeu $A$ avec $k\in[1,100]$. On pourra tracer l'évolution de la moyenne de $K$ en fonction de $k$ à la fin de l'exercice pour vérifier que $A$ est un jeu perdant (i.e. qui provoque la ruine du joueur s'il joue suffisamment longtemps).
On commencera par créer:
<ul>
<li> une fonction $jeuA(p)$ qui prend en argument p la probabilité p et qui renvoie le gain du joueur (s'il gagne ou perd au lancer de pièce).
<li> Une fonction $playA(p)$ qui prend le même argument et qui simule une partie de 100 tours du jeuA et renvoie la liste du capital à chaque tour.
<li> Une fonction $simulation(p)$ prenant le même argument, qui simmule 100 000 fois une partie de 100 tours et renvoie sous forme de liste la moyenne (sur 100000 calcul) du capital du joueur à chaque tour.
</ul></ol>

In [1]:
open Random;;
Random.self_init;;

let k0=0;;
    
let jeuA p =
    if Random.float 1.<=p then 1 else (-1)
    
let playA p =
    let nbre_jeux = 100 in
    let k = k0 in
    let resultat = Array.make nbre_jeux 0 in
    let rec loop num k =
        if num<nbre_jeux then begin
            let k' = k+(jeuA p) in
            resultat.(num)<-k;
            loop (num+1) k';
        end else resultat in
    loop 0 k;;

let array_add a b =
    Array.init (Array.length a) (fun i->a.(i)+b.(i));;
    
let simulationA p =
    let rec loop num total_A =
        if num<100000
        then loop (num+1) (array_add total_A (playA p))
        else total_A in
    let total_A = loop 0 (Array.make 100 0) in
    Array.init 100 (fun i->float_of_int total_A.(i)/.(float_of_int 100000));;

In [2]:
let pA1=1./.2.-.0.005 in
let res = (simulationA pA1).(99) in
assert ((float_of_int k0)+.(2.*.pA1-.1.-.0.01)*.100. < res && res < (float_of_int k0)+.(2.*.pA1-.1.+.0.01)*.100.)

<ol start="2">
<li> Quelle est l'espérance $E_A$ du jeu $A$ en utilisant les formule de probabilité traditionelle ? On pourra tracer $E_A$ en fonction de $k$ à la fin de l'exercice pour vérifier que ce calcul se superpose à la simulation précédente.
</ol>

In [3]:
let calculA n p =
    (* esperance du jeu A au bout de n tours *)
    (float_of_int k0)+.(float_of_int n)*.(2.*.p-.1.)

In [4]:
let pA1=1./.2.-.0.005 in
let res1 = calculA 100 pA1 in
let res2 = calculA 1000 pA1 in
assert (res1=(float_of_int k0+.100.*.(2.*.pA1-.1.)) && res2= (float_of_int k0+.1000.*.(2.*.pA1-.1.)))

<ol start="3">
<li> Simuler 100 000 fois, l'évolution du capital $K$ d'un joueur qui joue $k$ fois au jeu $B$ avec $k\in[1,100]$. On pourra tracer l'évolution de la moyenne de $K$ en fonction de $k$ pour vérifier que $B$ est un jeu perdant.
On commencera par créer:
<ul>
<li> une fonction $jeuB(K,p1,p2)$ qui prend en argument K le capital, p1 et p2 les probabailtés et qui renvoie le gain du joueur (s'il gagne ou perd au lancer de pièce).
<li> Une fonction $playB(p1,p2)$ qui simule une partie de 100 tours du jeuB et renvoie la liste du capital à chaque tour.
<li> Une fonction $simulationB(p)$ prenant le même argument, qui simmule 100 000 fois une partie de 100 tours et renvoie sous forme de liste la moyenne (sur 100000 calcul) du capital du joueur à chaque tour.</ul></ol>

In [5]:
let jeuB k p1 p2 =
    (*
    k = kapital
    p1 = proba de gain si K est multiple de 3
    p2 = proba de gain si K n'est pas multiple de 3
    *)
    if k mod 3=0 then
        if Random.float 1.<=p1 then 1 else (-1)
    else
        if Random.float 1.<=p2 then 1 else (-1);;
    
let playB p1 p2 =
    let nbre_jeux = 100 in
    let k = k0 in
    let resultat = Array.make nbre_jeux 0 in
    let rec loop num k =
        if num<nbre_jeux then begin
            let k' = k + jeuB k p1 p2 in
            resultat.(num)<-k';
            loop (num+1) k';
        end else resultat in
    loop 0 k;;
    
let simulationB p1 p2 =
    let rec loop num total_B =
        if num<100000
        then loop (num+1) (array_add total_B (playB p1 p2))
        else total_B in
    let total_B = loop 0 (Array.make 100 0) in
    Array.init 100 (fun i->float_of_int total_B.(i)/.(float_of_int 100000));;

<ol start="4">
<li> Quelle est l'espérance $E_B$ du jeu $B$ ? (On calculera les probabilités par récurrence).Tracer $E_B$ en fonction de $k$ à la fin de l'exercice pour vérifier que ce calcul se superpose à la simulation précédente.
</ol>

In [6]:
let list_pos liste element =
    let n = List.length liste in
    let rec loop pos liste =
        if pos<n then
            if List.hd liste = element 
            then pos
            else loop (pos+1) (List.tl liste)
        else -1 in
    loop 0 liste;;

In [7]:
let pB1=1./.10.-.0.005;;
let pB2=3./.4.-.0.005;;

let calculB n p1 p2 =
    let liste_proba_param = ref [] in
    let liste_proba_val   = ref [] in
    
    let rec proba_B k n =
        (*proba d'avoir le capital k au n-ième tour*)
        let pos = list_pos !liste_proba_param (k,n) in
        if pos != -1 then List.nth !liste_proba_val pos 
        else if n=0 && k=k0 then begin
            liste_proba_param:= (k0,0)::!liste_proba_param;
            liste_proba_val  := 1.::!liste_proba_val;
            1.
        end else if k-k0 = n then begin
            if (k-1) mod 3 =0 then begin
                let res = (proba_B (k-1) (n-1))*.p1 in
                liste_proba_param:= (k,n)::!liste_proba_param;
                liste_proba_val  := res::!liste_proba_val;
                res
            end else begin
                let res = (proba_B (k-1) (n-1))*.p2 in
                liste_proba_param:= (k,n)::!liste_proba_param;
                liste_proba_val  := res::!liste_proba_val;
                res end
        end else if k-k0 = (-n) then begin
            if (k+1) mod 3=0 then begin 
                let res = (proba_B (k+1) (n-1))*.(1.-.p1) in
                liste_proba_param:= (k,n)::!liste_proba_param;
                liste_proba_val  := res::!liste_proba_val;
                res
            end else begin
                let res = (proba_B (k+1) (n-1))*.(1.-.p2) in
                liste_proba_param:= (k,n)::!liste_proba_param;
                liste_proba_val  := res::!liste_proba_val;
                res end         
        end else begin
            let pi = (if (k-1) mod 3=0 then p1 else p2) in
            let qi = (if (k+1) mod 3=0 then (1.-.p1) else (1.-.p2)) in
            let res = proba_B(k-1) (n-1)*.pi+.proba_B(k+1) (n-1)*.qi in
            liste_proba_param:= (k,n)::!liste_proba_param;
            liste_proba_val  := res::!liste_proba_val;
            res end in
            
    let esperance_B n =
        let rec loop k e =
            if k<k0+n+1 
            then loop (k+2) (e+.(float_of_int k)*.(proba_B k n))
            else e in
        loop (k0-n) 0. in

    esperance_B n;;

In [9]:
let res1 = (simulationB pB1 pB2).(99) in
let res2 = calculB 100 pB1 pB2 in
print_float res1;print_newline();print_float res2;
assert (res2-.0.03 <res1 && res1<res2+.0.03)

-1.40492
-1.39232016825

<ol start="5">
<li> Simuler 100 000 fois, l'évolution du capital $K$ d'un joueur qui joue $k$ fois au jeu $AB$ avec $k\in[1,100]$. Tracer l'évolution de la moyenne de $K$ en fonction de $k$.
</ol>

In [9]:
let playA_et_B p p1 p2 =
    let nbre_jeux = 100 in
    let k = k0 in
    let resultat = Array.make nbre_jeux 0 in
    let rec loop num k =
        if num<nbre_jeux then begin
            let k' = (if Random.float 1.<0.5
                      then k+(jeuA p)
                       else k+(jeuB k p1 p2)) in
            resultat.(num)<-k';
            loop (num+1) k'
        end else resultat in
    loop 0 k;;

<ol start="6">
<li> Quelle est l'espérance $E_{AB}$ de ce jeu ? (On calculera les probabilités par récurrence). Tracer $E_{AB}$ en fonction de $k$. Vérifier que ce calcul se superpose à la simulation précédente.
</ol>

In [10]:
let calculAB n p p1 p2 =
    let liste_proba_param = ref [] in
    let liste_proba_val   = ref [] in
    
    let rec proba_A k n =
        (*proba d'avoir le capital k en jouant au jeu A n-ième tour*)
        (proba_AB (k-1)(n-1))*.p+.(proba_AB (k+1)(n-1))*.(1.-.p) 
        
    and proba_B k n =
        (*proba d'avoir le capital k en jouant au jeu B n-ième tour*)
        let pi = (if (k-1) mod 3=0 then p1 else p2) in
        let qi = (if (k+1) mod 3=0 then (1.-.p1) else (1.-.p2)) in
        (proba_AB (k-1) (n-1))*.pi+.(proba_AB (k+1) (n-1))*.qi 

    and proba_AB k n =
        let pos = list_pos !liste_proba_param (k,n) in
        if pos != -1 then List.nth !liste_proba_val pos 
        else if n=0 && k=k0 then begin
                liste_proba_param:=(k0,0)::!liste_proba_param;
                liste_proba_val  :=1.::!liste_proba_val;
                1. end
        else if abs(k-k0)>n then begin
                liste_proba_param:=(k,n)::!liste_proba_param;
                liste_proba_val  :=0.::!liste_proba_val;
                0. end
        else begin
            let res = 0.5*.(proba_A k n)+.0.5*.(proba_B k n) in
            liste_proba_param:=(k,n)::!liste_proba_param;
            liste_proba_val  :=res::!liste_proba_val;
            res end in
        
    let esperance_AB n =
        let rec loop k e =
            if k<k0+n+1 
            then loop (k+1) (e+.(float_of_int k)*.(proba_AB k n))
            else e in
        loop (k0-n) 0. in

    esperance_AB n;;

In [11]:
let range debut fin step =
   let rec range i acc =
     if i>=fin then List.rev acc
     else range (i+step) (i::acc) in
   range debut [];;

In [12]:
let array_min array = Array.fold_right min array array.(0);;
let array_max array = Array.fold_right max array array.(0);;

In [13]:
#use "topfind";;
#require "plplot";;
open Plplot;;
module P = Plot;;
let couleurs_list = [[ 0;255;255;255]; (*`white*)
                     [ 1;  0;  0;  0]; (*`black*)
                     [ 2;  0;  0;255]; (*`blue*)
                     [ 3;255;  0;  0]; (*`red*)
                     [ 4;165; 42; 42]; (*`brown*)
                     [ 5;  0;  0;  0]; [ 6;  0;  0;  0]; [ 7;  0;  0;  0]; [ 8;  0;  0;  0]; [ 9;  0;  0;  0]; 
                     [10;200;200;200]; (*`gray*)
                     [11;  0;255;255]; (*`light_blue*)
                     [12;  0;255;  0]; (*`green*)
                     [13;255;255;  0]; (*`yellow*)
                     [14;255;  0;255]; (*`pink*)
                     [15;160;  0;213]; (*`purple*) ]
let rec loop couleurs_list = match couleurs_list with
    | [n;r;g;b]::tl -> plscol0 n r g b; loop tl
    | _ -> ();;
let couleurs = (fun () -> plscolbg 255 255 255; loop couleurs_list)
let initialisation filename xmin xmax ymin ymax = 
        P.init (xmin, ymin) (xmax, ymax) `greedy (`svg `core) ~filename:(filename^".svg") ~pre:couleurs
let xlabel texte = P.text_outside `black (`bottom 0.5) 3. texte
let ylabel texte = P.text_outside `black (`left 0.5) 5. texte 
let label texte_x texte_y titre = P.label texte_x texte_y titre

- : unit = ()
Findlib has been successfully loaded. Additional directives:
  #require "package";;      to load a package
  #list;;                   to list the available packages
  #camlp4o;;                to load camlp4 (standard syntax)
  #camlp4r;;                to load camlp4 (revised syntax)
  #predicates "p,q,...";;   to set these predicates
  Topfind.reset();;         to force that packages will be reloaded
  #thread;;                 to enable threads

- : unit = ()


/usr/lib/ocaml/plplot: added to search path
/usr/lib/ocaml/plplot/plplot.cma: loaded


In [20]:
let epsilon=5./.1000.;;
let p=1./.2.-.epsilon;;
let p1=1./.10.-.epsilon;;
let p2=3./.4.-.epsilon;;
let nbre_jeux=100;;
let nbre_essais=100*1000;;
let rec loop num total_A total_B total_A_et_B =
    if num<nbre_essais
    then loop (num+1) 
              (array_add total_A (playA p))
              (array_add total_B (playB p1 p2))
              (array_add total_A_et_B (playA_et_B p p1 p2))
    else begin
        let convert array = Array.init nbre_jeux
        (fun i->float_of_int array.(i)/.(float_of_int nbre_essais)) in
        (convert total_A),(convert total_B),(convert total_A_et_B);
    end;;
let total_A, total_B, total_A_et_B = loop 0 
                                        (Array.make nbre_jeux 0)
                                        (Array.make nbre_jeux 0) 
                                        (Array.make nbre_jeux 0);;

let liste_k = range 1 (nbre_jeux+1) 1 in
let xs = Array.of_list (List.map float_of_int liste_k) in
let total_A_th = Array.of_list (List.map (fun k -> calculA k p) liste_k) in
let total_B_th = Array.of_list (List.map (fun k -> calculB k p1 p2) liste_k) in
let total_A_et_B_th = Array.of_list (List.map (fun k -> calculAB k p p1 p2) liste_k) in

let p = initialisation "graph" (array_min xs) (array_max xs) (-.2.) 2.
(*(array_min total_A) (array_max total_A_et_B)*) in
P.plot ~stream:p [P.points ~symbol:"+" `blue xs total_A_th; 
                  P.points ~symbol:"+" `green xs total_B_th; 
                  P.points ~symbol:"+" `red xs total_A_et_B_th; 
                  P.lines `blue xs total_A;
                  P.lines `green xs total_B;
                  P.lines `red xs total_A_et_B;
                  P.label "Tour" "Esperance" "Paradoxe de Parrondo";
                  P.legend ~pos:(P.viewport_pos 0.45 0.) ~text_offset:0. ~text_justification:0.
                          [[P.symbol_legend "récurrence jeu A" `blue "+"];
                           [P.symbol_legend "récurrence jeu B" `green "+"];
                           [P.symbol_legend "récurrence jeu A et B" `red "+"];
                           [P.line_legend "Monte Carlo jeu A" `blue];
                           [P.line_legend "Monte Carlo jeu B" `green];
                           [P.line_legend "Monte Carlo jeu A et B" `red]]];
P.finish ~stream:p ();;


<img src="graph.svg" />

<ol start="7">
<li>  $A$ et $B$ sont des jeux perdants. Le jeu $AB$ est-il également  perdant ? 
</ol>

<h3> Explication </h3>

La probabilité de gagner au jeu $B$ s'écrit: $P_B=\alpha.p_1+(1-\alpha).p_2$ avec $\alpha$ la probabilité que le capital soit un multiple de $m=3$ (i.e. la probabilité de lancer la pièce 1). On voit sur la simulation que $P_B<\frac12$ puisque $B$ est un jeu perdant.

D'où $\alpha.(\frac1{10}-\frac34)+\frac34-\varepsilon<\frac12$
$\Rightarrow$ $\alpha>(\frac14-\varepsilon).\frac{20}{13}=\frac{245}{650}=\frac{49}{130}\simeq0.37>\frac13$.

Dans le jeu $B$, la probabilité de tomber sur un multiple de 3 est supérieure à $\frac13$.

La probabilité de gagner au jeu $AB$ s'écrit: $P_{AB}=\frac12.p+\alpha'.p_1+(\frac12-\alpha').p_2$ avec $\alpha'$ la probabilité de lancer la pièce 1. (Somme des probabilités $\frac12+\alpha'+(\frac12-\alpha')=1$). On voit sur la simulation que $P_{AB}>\frac12$ puisque $AB$ est un jeu gagnant.

D'où $\alpha'.(\frac1{10}-\frac34)+\frac58-\varepsilon>\frac12$
$\Rightarrow$ $\alpha'<(\frac18-\varepsilon).\frac{20}{13}=\frac{24}{130}\simeq 0,18<\frac13$.

Dans le jeu $AB$, la probabilité de jouer la pièce 1 est inférieure à $\frac13$.

<h4>Chaine de Markov</h4>

Un processus markovien est un processus dans lequel les probabilités pour aller vers les configurations au tour $k+1$ ne dépendent que des configurations au tour $k$ (mémoire limité à un tour).

<h5>Jeu $B$</h5>

On considère d'abord le jeu $B$ avec trois états: <br>
&#9450; correspondant à un capital $K\equiv0\,[3]$<br>
&#9312; capital $K\equiv 1\,[3]$<br>
&#9313; capital $K\equiv 2\,[3]$

On a le graphe suivant (avec $q_i=1-p_i$):

<img src="FIGURE_2.svg">

Au tour n${}^\circ k$, les probabilités de présence du système dans les différents états sont représentées par un vecteur ligne $\vec V_k$.
La matrice de transition $[T]$ vers l'état suivant s'écrit:

$[T]=\begin{bmatrix}
0 & p_1 & q_1 \\
q_2 & 0 & p_2\\
p_2 & q_2 & 0
\end{bmatrix}$

Au tour n${}^\circ k+1$, les probabilités de présence dans les différents états s'obtiennent par: $\vec V_{k+1}=\vec V_k.[T]$.
Par exemple, si on part de l'état 0 représenté par [1,0,0], l'état suivant sera: $[1,0,0].[T]=[0,p_1,q_1]$.
 
Dans le cas général, $[T]$ est défini par $T_{ij}=Pr(K_{k+1}=j | K_k=i)$.

La matrice transposée s'écrit: ${}^t[T]=\begin{bmatrix}
0 & q_2 & p_2 \\
p_1 & 0 & q_2\\
q_1 & p_2 & 0
\end{bmatrix}$.

Pour obtenir le temps moyen d'occupation de chaque état, il faut trouver les états stationnaires en cherchant le vecteur propre associé à la valeur propre 1 (https://fr.wikipedia.org/wiki/Probabilit%C3%A9_stationnaire_d%27une_cha%C3%AEne_de_Markov).

Dans ce vecteur propre $\vec v=\begin{bmatrix}v_0\\ v_1\\ v_2\end{bmatrix}$, $v_0$ représente la limite asymptotique du temps moyen d'occupation de l'état 0, $v_1$ le temps moyen de l'occupation de l'état 1 et $v_2$ le temps moyen d'occupation de l'état 2.

On obtient $\vec v=\begin{bmatrix}
(1-p_2+p_2^2)/S\\
(1-p_2+p_1.p_2)/S\\
(1-p_1+p_1.p_2)/S
\end{bmatrix}$ où $S$ est tel que la somme des composantes de $\vec v$ soit égale à 1.

On obtient $\alpha$ d'après $v_0$ la première composante de $\vec v$:
<table border=1 width="200"><tr><td align="center">$\alpha=\frac{1-p_2+p_2^2}{3-p_1-2.p_2+2.p_1.p_2+p_2^2}$</td></tr></table>.

On trouve: $\alpha=0.38361175899506295$ d'où <table border=1  width="450"><tr><td align="center"><div>$P_B= \alpha.p_1+(1-\alpha).p_2=0.49565235665320906<0.5$</div></td></tr></table>

Le jeu $B$ est bien perdant[1].

[1] <i>
L'article https://fr.wikipedia.org/wiki/Paradoxe_de_Parrondo est faux: si $p_1=\varepsilon$ et $p_2=\frac34-2.\varepsilon$, alors $\alpha=\frac{-\varepsilon^2 + 0.5.\varepsilon - 0.8125}{\varepsilon^2 - \varepsilon - 2.0625}=0.391794338504698\neq\frac13$ pour $\varepsilon=\frac5{1000}$.</i>

On peut tracer l'ensemble des couples $(p_1,p_2)$ donnant un jeu $B$ perdant.
Le point correspond au couple $(p_1,p_2)$ choisi dans cet exemple.

<img src="jeuB_perdant_fig.svg">

<h5>Jeu $AB$</h5>

On considère maintenant le jeu $AB$ avec six états:<br>
&#9450; $K\equiv0\,[3]$ et jeu $A$,<br>
&#9312; $K\equiv 1\,[3]$ et jeu $A$;<br>
&#9313; $K\equiv 2\,[3]$ et jeu $A$;<br>
&#9314; $K\equiv0\,[3]$ et jeu $B$,<br>
&#9315; $K\equiv 1\,[3]$ et jeu $B$;<br>
&#9316; $K\equiv 2\,[3]$ et jeu $B$.<br>

On a le graphe suivant:
<img src="FIGURE_7.svg" width=75%>


La matrice de transition $[T]$ vers l'état suivant s'écrit: $[T]=\frac12.\begin{bmatrix}
0 & p & q & 0 & p & q\\
q & 0 & p & q & 0 & p \\
p & q & 0 & p & q & 0 \\
0 & p_1 & q_1 & 0 & p_1 & q_1 \\
q_2 & 0 & p_2 & q_2 & 0 & p_2 \\
p_2 & q_2 & 0 & p_2 & q_2 & 0
\end{bmatrix}$. 

La matrice transposée s'écrit: ${}^t[T]=\frac12.\begin{bmatrix}
0 & q & p & 0 & q_2 & p_2 \\
p & 0 & q & p_1 & 0 & q_2\\
q & p & 0 & q_1 & p_2 & 0\\
0 & q & p & 0 & q_2 & p_2 \\
p & 0 & q & p_1 & 0 & q_2\\
q & p& 0 & q_1 & p_2 & 0\\
\end{bmatrix}$.

Le vecteur propre associé à la valeur propre 1 est $\vec v=\begin{bmatrix}
v_0 \\ v_1 \\ v_2 \\ v_3 \\ v_4 \\ v_5 \end{bmatrix}$.

On montre que $v_0=v_3$, $v_1=v_4$ et $v_2=v_5$.

On a: $v_0=\frac{4-(q+q_2).(p+p_2)}{S}$, $v_1=\frac{2.(p+p_1)+(q+q_1).(q+q_2)}{S}$
et $v_2=\frac{2.(q+q_1)+(p+p_1).(p+p_2)}{S}$ où $S$ est tel que la somme des composantes de $\vec v$ est égale à 1. On a: $S=6.p^2 + 4.p.p_1 + 8.p.p_2 - 12.p + 4.p_1.p_2 - 4.p_1 + 2.p_2^2 - 8.p_2 + 24$

La probabilité $\alpha'$ de lancer la pièce ayant la probabilité $p_1$ correspond à

<table border=1 width="450"><tr><td> $\alpha'=v_3=v_0=\frac{p^2 + 2.p.p_2 - 2.p + p_2^2 - 2.p_2 + 4}{2.(3.p^2 + 2.p.p_1 + 4.p.p_2 - 6.p + 2.p_1.p_2 - 2.p_1 + p_2^2 - 4.p_2 + 12)}$. </td></tr></table>

On obtient $\alpha'=0.17253521$ d'où <table border=1 width="450"><tr><td> $P_{AB}=\frac12.p+\alpha'.p_1+(\frac12-\alpha').p_2=0.5078521>0.5$.</td></tr></table>

Le jeu $AB$ est bien gagnant !

Si on impose $p=\frac12-\frac5{1000}$, on peut tracer l'ensemble des couples $(p_1,p_2)$ donnant un jeu $AB$ gagnant.
Le point correspond au couple $(p_1,p_2)$ choisi dans cet exemple.

<img src="jeuAB_gagnant_fig.svg">

En superposant les deux graphes, on voit que la zone donnant $B$ perdant et $AB$ gagnant est très restreinte (pour $m=3$).

<img src="publi_fig9.svg">

<h3>Généralisation au cas $m=4$</h3>

Pour le jeu $B$.

La matrice de transition $[T]$ vers l'état suivant s'écrit: $[T]=\begin{bmatrix}
0 & p_1 & 0  & q_1 \\
q_2 & 0 & p_2 & 0\\
0 & q_2 & 0 & p_2\\
p_2 & 0 & q_2 & 0
\end{bmatrix}$. 

De la même façon: on transpose, on cherche le vecteur propre associé à la valeur propre 1, on norme le vecteur, on obtient $\alpha=\frac{2.p_2^2 - 2.p_2 + 1}
{2.(2.p_1.p_2 - p_1 + 2.p_2^2 - 3.p_2 + 2)}$

Le jeu $B$ est perdant si et seulement si: $P_B=\alpha.p_1+(1-\alpha).p_2<\frac12$.

Graphiquement, on peut tracer l'ensemble des couples $(p_1,p_2)$ donnant un jeu $B$ perdant.


<img src="jeuB_perdant_m4_fig.svg">

Pour le jeu $AB$.

La matrice de transition $[T]$ vers l'état suivant s'écrit: $[T]=\frac12.\begin{bmatrix}
0 & p & 0  & q & 0 & p & 0  & q\\
q & 0 & p & 0 & q & 0 & p & 0\\
0 & q & 0 & p & 0 & q & 0 & p\\
p & 0 & q & 0 & p & 0 & q & 0 \\
0 & p_1 & 0  & q_1 & 0 & p_1 & 0  & q_1\\
q_2 & 0 & p_2 & 0 & q_2 & 0 & p_2 & 0\\
0 & q_2 & 0 & p_2 & 0 & q_2 & 0 & p_2\\
p_2 & 0 & q_2 & 0 & p_2 & 0 & q_2 & 0
\end{bmatrix}$. 

De la même façon, on obtient: 
$\alpha'=\frac{p^2 + 2.p.p_2 - 2.p + p_ 2^2 - 2.p_2 + 2}{4.(2.p^2 + p.p_1 + 3.p.p_2 - 4.p + p_1.p_2 - p_1 + p_2^2 - 3.p_2 + 4)}$

Le jeu $AB$ est gagnant ssi: $P_{AB}=\frac12.p+\alpha'.p_1+(\frac12-\alpha').p_2>\frac12$.

Si on impose $p=\frac12-\frac5{1000}$, on peut tracer l'ensemble des couples $(p_1,p_2)$ donnant un jeu $AB$ gagnant.

<img src="jeuAB_gagnant_m4_fig.svg">

En superposant les deux graphes, on voit que la zone donnant $B$ perdant et $AB$ gagnant est  similaire au cas $m=3$.

<img src="superposition_jeuB_jeuAB_m4_fig.svg">

On peut vérifier avec $m=4$, $p=\frac12-\frac5{1000}$, $p_1=0.025$ et $p_2=0.75$ (voir point sur le graphique) que l'on obtient un jeu $AB$ encore plus favorable que dans l'exemple précédent ($m=3$, $p=\frac12-\frac5{1000}$, $p_1=\frac1{10}-\frac5{1000}$ et $p_2=\frac34-\frac5{1000}$).


<img src="Parondo_m4_fig.svg">


On peut continuer ainsi pour $m=5$, $m=6$, ...

Les calculs deviennent rapidement fastidieux. On peut résoudre le problème avec <tt> sympy</tt>.
Ci-dessous le cas $m=6$ pour le jeu $AB$.

<pre>
from sympy import *
p,p1,p2=symbols("p,p1,p2")
q,q1,q2=symbols("q,q1,q2")
alpha=symbols("alpha")
q=1-p
q1=1-p1
q2=1-p2

M=Matrix([
[      -1, (q+q2)/2,        0,        0,        0],
[(p+p2)/2,       -1, (q+q2)/2,        0,        0],
[       0, (p+p2)/2,       -1, (q+q2)/2,        0],
[       0,        0, (p+p2)/2,       -1, (q+q2)/2],
[       0,        0,        0, (p+p2)/2,       -1]])
V=Matrix([
[-(p+p1)/2*alpha],
[0],
[0],
[0],
[-(q+q1)/2*alpha]])

Probas_etats_AB=M.inv()*V
Probas_etats_AB.simplify()
valeur_alpha_prime=solve(2*alpha+2*sum(Probas_etats_AB)-1,alpha)[0]
</pre>

Pour le jeu $B$, il suffit de remplacer <t>p</t> par <t>p2</t> et <t>q</t> par <t>q2</t> dans la matrice <t>M</t> et <t>p</t> par <t>p1</t> et <t>q</t> par <t>q1</t> dans le vecteur <t>V</t>; la condition pour normer s'écrit:
<t> valeur\_alpha=solve(alpha+sum(Probas\_etats\_B)-1,alpha)[0]</t>.

\vskip\baselineskip
On obtient les valeurs de $\alpha$ et $\alpha'$ suivantes:
 
<ul>
<li>$m=5$
$\alpha=\frac{p_2^4 - 2.p_2^3 + 4.p_2^2 - 3.p_2 + 1}
{4.p_1.p_2^3 - 6.p_1.p_2^2 + 8.p_1.p_2 - 3.p_1 + p_2^4 - 4.p_2^3 + 12.p_2^2 - 12.p_2 + 5}$
<br>
$\alpha'=\frac{p^4 + 4.p^3.p_2 - 4.p^3 + 6.p^2.p_2^2 - 12.p^2.p_2 + 16.p^2 + 4.p.p_2^3 - 12.p.p_2^2 + 32.p.p_2 - 24.p + p_2^4 - 4.p_2^3 + 16.p_2^2 - 24.p_2 + 16}{2.(5.p^4 + 4.p^3.p_1 + 16.p^3.p_2 - 20.p^3 + 12.p^2.p_1.p_2 - 12.p^2.p_1 + 18.p^2.p_2^2 - 48.p^2.p_2 + 80.p^2 + 12.p.p_1.p_2^2 - 24.p.p_1.p_2 + 32.p.p_1 + 8.p.p_2^3 - 36.p.p_2^2 + 128.p.p_2 - 120.p + 4.p_1.p_2^3 - 12.p_1.p_2^2 + 32.p_1.p_2 - 24.p_1 + p_2^4 - 8.p_2^3 + 48.p_2^2 - 96.p_2 + 80)}$
<br>
<li>$m=6$
<br>
$\alpha=\frac{3.p_2^4 - 6.p_2^3 + 7.p_2^2 - 4.p_2 + 1}{2.(6.p_1.p_2^3 - 9.p_1.p_2^2 + 7.p_1.p_2 - 2.p_1 + 3.p_2^4 - 9.p_2^3 + 14.p_2^2 - 10.p_2 + 3)}$
<br>
$\alpha'=\frac{ 3.p^4 + 12.p^3.p2 - 12.p^3 + 18.p^2.p2^2 - 36.p^2.p2 + 28.p^2 + 12.p.p2^3 - 36.p.p2^2 + 56.p.p2 - 32.p + 3.p2^4 - 12.p2^3 + 28.p2^2 - 32.p2 + 16}{4*(9.p^4 + 6.p^3.p1 + 30.p^3.p2 - 36.p^3 + 18.p^2.p1.p2 - 18.p^2.p1 + 36.p^2.p2^2 - 90.p^2.p2 + 84.p^2 + 18.p.p1.p2^2 - 36.p.p1.p2 + 28.p.p1 + 18.p.p2^3 - 72.p.p2^2 + 140.p.p2 - 96.p + 6.p1.p2^3 - 18.p1.p2^2 + 28.p1.p2 - 16.p1 + 3.p2^4 - 18.p2^3 + 56.p2^2 - 80.p2 + 48)}$
</ul>

<br>
Les couples $(p_1,p_2)$ permettant d'observer le paradoxe de Parrondo (pour $p=\frac12-\frac5{1000}$) sont représentés ci-dessous (entre les deux courbes).

<table border="0" bordercolor="white">
<tr>
<td><img src="superposition_jeuB_jeuAB_m3_zoom_fig.svg"></td>
<td><img src="superposition_jeuB_jeuAB_m4_zoom_fig.svg"></td>
</tr>
</table>

<table border="0" bordercolor="white">
<tr>
<td><img src="superposition_jeuB_jeuAB_m5_zoom_fig.svg"></td>
<td><img src="superposition_jeuB_jeuAB_m6_zoom_fig.svg"></td>
</tr>
</table>

<h2>Conclusion</h2>

Dans la version originale du paradoxe de Parrondo, les probabilités dépendant du capital du joueur.
On n'a analysé ici seulement le cas où l'on joue aléatoirement aux jeux $A$ et $B$, mais
il existe des variantes du paradoxe où l'on joue aux jeux $A$ et $B$ selon une séquence déterminée (ex: $AABBAABB\dots$).

Il existe également des variantes où les probabilités dépendent des gains/pertes antérieurs.
Par exemple, le jeu $A$ est inchangé (gain avec une probabilité $p=\frac12-\varepsilon$) et le jeu $B$ nécessite maintenant trois pièces ayant respectivement des probabilités de gains $p_1$, $p_2$, $p_3$ (ex: $p_1=0.9-\varepsilon$, $p_2=0.25-\varepsilon$ et $p_3=0.7-\varepsilon$). Au tour n$^\circ k$, on joue l'une des pièces suivant les résultats des tours $k-1$ et $k-2$:

<table border="0" bordercolor="white" width=68% >
<tr>
<td width=33% ><center>résultat du tour $k-2$</center></td>
<td width=33% ><center>résultat du tour $k-1$</center></td>
<td width=33% ><center>pièce à jouer au tour $k$</center></td>
</tr>
<tr>
<td width=33% ><center>perdu</center></td>
<td width=33% ><center>perdu</center></td>
<td width=33% ><center>1</center></td>
</tr>
<tr>
<td width=33% ><center>perdu</center></td>
<td width=33% ><center>gagné</center></td>
<td width=33% ><center>2</center></td>
</tr>
<tr>
<td width=33% ><center>gagné</center></td>
<td width=33% ><center>perdu</center></td>
<td width=33% ><center>2</center></td>
</tr>
<tr>
<td width=33% ><center>gagné</center></td>
<td width=33% ><center>gagné</center></td>
<td width=33% ><center>3</center></td>
</tr>
</table>

Les applications sont nombreuses: à la fois théorique (il y a une analogie avec le fameux cours de thermodynamique de Feynman sur le mouvement brownien avec une roue à cliquets (https://en.wikipedia.org/wiki/Brownian_ratchet) et pratique (système de spins, génétique humaine).