$\newcommand\indi[1]{{\mathbf 1}_{\displaystyle #1}}$
$\newcommand\inde[1]{{\mathbf 1}_{\displaystyle\left\{ #1 \right\}}}$
$\newcommand{\ind}{\inde}$
$\newcommand\E{{\mathbf E}}$
$\newcommand\P{{\mathbf P}}$
$\newcommand\Cov{{\mathrm Cov}}$
$\newcommand\Var{{\mathrm Var}}$

# La question à résoudre

 On place deux oeufs "au hasard" dans une matrice $p\times q$. On
 considère deux joueurs ($A$ et $B$).  Le joueur $A$ parcours la
 matrice en colonne, le joueur $B$ en ligne. Le gagnant est celui qui
 atteint le premier l'un des deux oeufs. La question est de savoir si
 ce jeu est équitable (i.e. les deux joueurs ont ils la même
 probabilité de gagner ?) et de déterminer, si ce n'est pas le cas,
 lequel a un avantage.
  
On trouvera la réponse à cette question lorsque $p=3$ et $q=4$ sur le
site de la NSA.  Nous verrons que l'on peut répondre très simplement
à ces questions à l'aide d'un programme de quelques lignes pour une valeur
arbitraire de $p$ et $q$. 

Les réponses dépendent des
valeurs de $p$ et $q$ de façon surprenante~: elles sont différentes
pour $(p=3,q=4)$, $(p=4,q=4)$ et $(p=4,q=5)$!

## Étude de la question posée par une méthode de Monte-Carlo

On commence par traiter la question par simulation. On suppose (ce qui
est implicite dans la formulation du problème) que les $2$ oeufs
sont placés, indépendamment, uniformément sur les $p\times q$ cases de
la matrice. Il peut donc arriver que les $2$ oeufs soient au même
endroit (à vrai dire le problème ne précise pas ce détail), mais on
verra que cela n'a pas d'importance pour la réponse à la question posée.

### Simulation d'une loi discrète

On cherche à réaliser un tirage selon la loi d'une variable aléatoire $N$ qui prend ses valeurs 
dans $\{1,\ldots,n\}$ dont la loi donnée par le vecteur $(P[k-1],1\leq k \leq n)$.

<span style="color:blue">
    Lorsque la loi est uniforme sur $\{1,\ldots,n\}$, on peut
vérifier (exercice) que $\E(N)=\frac{n+1}{2}$ et $\Var(N)=\frac{(n+1)(n-1)}{12}$.</span> 

In [1]:
import random;
import numpy as np;
import math

def rand_disc(P):
# P est une loi discrète qui charge les entiers 1,...,p
# le vecteur P[i-1],pour i=1,...,p donne la probabilité d'obtenir i .
# Il est décalé de 1 pour tenir compte de la convention "Python"
# de vecteur qui débute en 0.

# Version itérative.
    U=np.random.rand(1) # On tire selon une loi uniforme entre 0 et 1
    # "On inverse la fonction de répartition" : voir cours du premier semestre.

    Q=0
    i=0
    while (Q <= U):
        Q = Q + P[i];
        i = i + 1;
    return i;

n=12
P=np.ones(n)/n
X=np.zeros(1000,dtype=int) # dtype=int pour indiquer que le tableau est constitué d'entier
for i in range(1000):
    X[i]=rand_disc(P)
print("moyenne empirique:",np.mean(X)," - moyenne attendue ",(n+1)/2) # np.mean calcule moyenne des tirages
print("variance:",np.var(X)," - variance attendue ",(n+1)*(n-1)/12) # np.var la variance des tirages

moyenne empirique: 6.404  - moyenne attendue  6.5
variance: 12.728784  - variance attendue  11.916666666666666


In [2]:
def test_0():
# Un exemple de tirages uniformes sur |$\{1,2,3\}$|
    p=3;
    P=np.ones(p)/p;# loi uniforme sur |$\{1,2,3\}$|

    N=10;
    X=np.zeros(N,dtype=int)
    for i in range(N): # N tirages uniformes sur |$\{1,2,3\}$|
        X[i] = rand_disc(P)
        print(X[i], end=' ')
        
test_0()

3 2 2 2 2 2 2 2 3 2 

### Simulation des temps d'atteinte

On tire le premier ouf en $(U_1,V_1)$, $U_1$ (l'indice de ligne)
et $V_1$ (l'indice de colonne) étant indépendantes, de loi uniforme
respectivement sur $\{1,\ldots,p\}$ et $\{1,\ldots,q\}$. Si le premier
oeuf se trouve en $(U_1,V_1)$, le temps d'atteinte de cet oeuf
par $A$ (parcours en colonne) est donné par
$$
   t_1^A=(V_1-1) p+U_1,
$$
et, pour $B$ (parcours en ligne), par
$$
t_1^B=(U_1-1) q+V_1,
$$
avec des formules identiques pour le deuxième {\oe}uf:
$$
t_2^A=(V_2-1) p+U_2,\quad t_2^B=(U_2-1) q+V_2,
$$ 
$U_2$ et $V_2$ étant indépendantes, toujours de lois uniformes,
indépendantes du couple $(U_1,V_1)$.

<span style="color:blue">
    Noter que l'on peut calculer la loi (commune) de $t_1^A$, $t_1^B$,
$t_2^A$, $t_2^B$ (loi uniforme sur $\{1,\ldots,p\times q\}$) et
montrer que $t_1^A$ s'obtient comme une fonction déterministe de
$t_1^B$.
</span> 

Avec ces éléments, il est facile d'écrire une fonction qui réalise le tirage
des deux oeufs dans la matrice et d'en déduire les temps que mettent $A$
et $B$ pour trouver le premier oeuf.

In [3]:
def random_times(p,q):
# On simule selon des lois uniformes sur 1:p et 1:q
# On en déduit les tirages de T_A et T_B

    P=np.ones(p)/p;# Loi uniforme sur 1:p
    Q=np.ones(q)/q;# Loi uniforme sur 1:q
    i_1=rand_disc(P);j_1=rand_disc(Q);
    i_2=rand_disc(P);j_2=rand_disc(Q);

    # Calcul de T_A et T_B en fonction de (i_1,j_1) (i_2,j_2)
    t_1_A = (j_1-1)*p+i_1;
    t_2_A = (j_2-1)*p+i_2;
    T_A = min(t_1_A,t_2_A);
  
    t_1_B = (i_1-1)*q+j_1;
    t_2_B = (i_2-1)*q+j_2;
    T_B = min(t_1_B,t_2_B);
    
    return [T_A,T_B]

In [4]:
random_times(2,3)

[3, 2]

Il ne reste plus qu'à faire suffisamment de tirages 
pour répondre (en partie) à la question posée.

In [5]:
def qui_gagne_MC(p,q,N):
    statA=0;statB=0;
    for i in range(N):
        [T_A,T_B] = random_times(p,q);
        if (T_B < T_A): # B gagne
            statB=statB+1;
        elif (T_A < T_B):  # A gagne
            statA=statA+1;
    erreur=1/math.sqrt(N);# erreur maximum probable
    pA=statA/N;pB=statB/N;
    print("pA=%.3f+-%.3f, pB=%.3f+-%.3f\n",'Pa=',statA/N,'+-',erreur,', Pb=', statB/N,'+-',erreur)
    if (pA+erreur < pB-erreur):
        print("p=",p,",q=",q,": Il est très probable que B gagne en moyenne.")
    elif (pA-erreur > pB+erreur):
        print("p=",p,",q=",q," : ","Il est très probable que A gagne en moyenne.")
    else:
        print("p=",p,",q=",q," N=", N," : On ne peut pas conclure: ",p,q,N)
        print("il faut augmenter le nombre de tirages N.")

def test_1():
    N=10000;
    qui_gagne_MC(2,3,N)
    qui_gagne_MC(3,4,N)
    qui_gagne_MC(4,5,N)
    qui_gagne_MC(4,4,N)

test_1()

pA=%.3f+-%.3f, pB=%.3f+-%.3f
 Pa= 0.2724 +- 0.01 , Pb= 0.342 +- 0.01
p= 2 ,q= 3 : Il est très probable que B gagne en moyenne.
pA=%.3f+-%.3f, pB=%.3f+-%.3f
 Pa= 0.3941 +- 0.01 , Pb= 0.4136 +- 0.01
p= 3 ,q= 4  N= 10000  : On ne peut pas conclure:  3 4 10000
il faut augmenter le nombre de tirages N.
pA=%.3f+-%.3f, pB=%.3f+-%.3f
 Pa= 0.4388 +- 0.01 , Pb= 0.4397 +- 0.01
p= 4 ,q= 5  N= 10000  : On ne peut pas conclure:  4 5 10000
il faut augmenter le nombre de tirages N.
pA=%.3f+-%.3f, pB=%.3f+-%.3f
 Pa= 0.362 +- 0.01 , Pb= 0.3672 +- 0.01
p= 4 ,q= 4  N= 10000  : On ne peut pas conclure:  4 4 10000
il faut augmenter le nombre de tirages N.


<span style="color:blue">
Noter que le théorème de la limite centrale permet (exercice!) de
montrer que l'erreur "probable maximale" est de l'ordre de
$1/\sqrt{n}$ (C'est le même résultat qui permet d'évaluer
approximativement l'erreur d'un sondage d'opinion).</span>

Dans le cas $p=2$, $q=3$ on arrive assez facilement ($N=10000$ suffit
largement) à se convaincre que $B$ gagne en moyenne.  C'est plus
difficile pour $(p=3,q=4)$ ($N=100000$ convient).  Ça devient délicat
pour $(p=4,q=5)$ (il faut prendre $N\approx 1000000$ pour conclure que
c'est $A$ qui gagne).  Dans les cas où $p=q$ (où l'on peut prouver
qu'il y a égalité des probabilités), une méthode de simulation ne sera
__jamais__ concluante.
 
Il nous faut une méthode exacte de calcul de ces probabilités. C'est
ce que nous allons faire maintenant.

# 2. Un calcul exact par énumération exhaustive

L'espace de probabilité $\Omega$ étant fini, il suffit d'énumérer
$\Omega$ pour calculer la probabilité~: on génère toutes les valeurs
possibles pour les positions des oeufs $(i_1,j_1)$ et $(i_2,j_2)$
(tous ces couples (de couples!) sont supposés équiprobables), on calcule $T_A$
et $T_B$ et l'on fait des stats sur celui qui gagne.

<span style="color:blue">
On en profite pour calculer la loi du couple $(T_A,T_B)$ et pour vérifier que les
lois de $T_A$ et $T_B$ sont identiques (exercice, pour une correction voir la 
version `scilab` du sujet).

On vérifie aussi que la loi de  $(T_A,T_B)$ n'est pas identique à celle de  $(T_B,T_A)$ (sauf si $p=q$)
et que $T_A$ n'est jamais indépendante de $T_B$.
</span>

In [6]:
def qui_gagne_elem(p,q):
# On énumère toutes les positions possibles
# et on en déduit lequel des joueurs gagne en moyenne

    Ascore=0;Bscore=0;nbre_cas_egalite=0
 
    # On génére toutes les positions pour les 2 oeufs
    # Attention en Python: range(1,p+1) = {1,2, ...,p}, c'est bien ce que l'on veut
    for i_1 in range(1,p+1) :
        for j_1 in range(1,q+1) :
            for i_2 in range(1,p+1) :
                for j_2 in range(1,q+1) :
                    T_A=min((j_1-1)*p+i_1,(j_2-1)*p+i_2)
                    T_B=min((i_1-1)*q+j_1,(i_2-1)*q+j_2)
                    if T_A > T_B :
                        Bscore=Bscore+1
                    elif T_A < T_B:
                        Ascore=Ascore+1
                    else: # T_A == T_B
                        nbre_cas_egalite=nbre_cas_egalite+1

    print('p=',p,', q=',q, ': ',end='') # end='' pour eviter le passage à la ligne
    if(Bscore>Ascore): print("c'est B qui gagne")
    elif (Ascore>Bscore): print("c'est A qui gagne")
    else: print("cas d'égalité")

def histo(p,q):
# Calcule la loi du couple (T_A,T_B) par énumération exhaustive des cas

    nbre=p*q;# valeur maximale de T_A ou T_B
    
    # Les tableaux Python sont indicés à partir de 0 -> on rajoute 1
    H_AB=np.zeros([nbre+1,nbre+1]);
    
    # On génére toutes les positions pour les 2 oeufs
    for i_1 in range(1,p+1) :
        for j_1 in range(1,q+1) :
            for i_2 in range(1,p+1) :
                for j_2 in range(1,q+1) :
                    T_A=min((j_1-1)*p+i_1,(j_2-1)*p+i_2)
                    T_B=min((i_1-1)*q+j_1,(i_2-1)*q+j_2)
                    # met à jour le nbre de tirages valant (k,l)
                    H_AB[T_A,T_B] = H_AB[T_A,T_B] + 1
    H_AB = H_AB/(nbre*nbre) 
    return H_AB

p=40;q=45
qui_gagne_elem(p,q)
#samples=simul_couple(p,q)

# On calcule la loi du couple (T_A,T_B)
H_AB=histo(p,q)

# On vérifie que H_AB est bien la loi d'un couple
if np.abs(np.sum(H_AB)-1) <= 1.e-7 :
    print('H_AB est bien de somme 1')

# Verification que les lois marginales sont identiques.
H_A=np.sum(H_AB,axis=0)
H_B=np.sum(H_AB,axis=1)

# H_A est forcément égal à H_B : on vérifie
if np.linalg.norm(H_A-H_B) >= 1.e-7 :
    print("Warning: les lois de T_A et T_B doivent être égales.\n")
else:
    print('Les lois de T_A et T_B sont bien égales.');

# Par contre (T_A,T_B) n'a pas la meme loi que (T_B,T_A) lorsque p != q
# Elles doivent l'etre!
if np.linalg.norm(H_AB-np.transpose(H_AB)) >= 1.e-7 :
    print("La loi du couple (T_A,T_B) n'est pas symétrique (c'est normal si p!=q) !\n")
else:
    print('La loi du couple (T_A,T_B) est symétrique: p et q sont probablement égaux.');

if p*q <=10:
    print(H_AB[1:p*q+1,1:p*q+1])

p= 40 , q= 45 : c'est A qui gagne
H_AB est bien de somme 1
Les lois de T_A et T_B sont bien égales.
La loi du couple (T_A,T_B) n'est pas symétrique (c'est normal si p!=q) !



In [9]:
def test_2():
    qui_gagne_elem(3,4);
    qui_gagne_elem(4,4);
    qui_gagne_elem(4,5);
  
    #for p in range(2,5): qui_gagne_elem(p,p+1)
    #for p in range(2,9): qui_gagne_elem(p,p+2)
    #for p in range(2,7): qui_gagne_elem(p,p+3)

test_2()

p= 3 , q= 4 : c'est B qui gagne
p= 4 , q= 4 : cas d'égalité
p= 4 , q= 5 : c'est A qui gagne


On retrouve le résultat, un peu surprennant, annoncé au début.