# TP Des espions parmi les civils (diviser pour régner) 

Dans un contexte de guerre froide, des espions se sont glissés parmi les civils travaillant dans un centre de recherche et ont volé des données secrètes de la plus haute importance. 

**On suppose qu'il y a strictement plus de civils que d'espions.**

On note $n$ le nombre total de personnes (l'ensemble des civils et des espions).

Arrive alors sur les lieux un inspecteur qui cherche à démasquer les espions. Il peut organiser des confrontations entre deux personnes, celles-ci pouvant alors reconnaitre l'autre comme un civil, ou au contraire l'accuser d'être un espion.

Il sait que les espions peuvent mentir (ou dire la vérité), mais que les civils disent toujours la vérité. Chaque civil sait qui est civil et qui est espion. Ainsi, lors d'une confrontation entre deux personnes, les déclarations des civils sont toujours exactes. 

On notera (DA,DB) les déclarations entre 2 personnes A et B, DA étant l'affirmation faite par A au sujet de B et DB l'affirmation faite par B au sujet de A. Par exemple si la confrontation entre A et B a pour résultat ('civil','espion') cela signifie que A affirme que B est un civil et B affirme que A est un espion.

1. Quels peuvent être les résultats d'une confrontation entre A et B si:
  * A et B sont 2 civils,
  * A est un civil et B un espion ou vice-versa,
  * A et B sont 2 espions.

>* A et B sont 2 civils : comme ils disent forcément la vérité, (C,C)
>* A est un civil et B un espion ou vice-versa : si A est le civil, (E,C ou E), et si B est le civil (C ou E,E)
>* A et B sont 2 espions : (C ou E,C ou E)

# 1. Représentation des personnes et du centre

On supposera que les espions disent la vérité une fois sur deux.

On va définir une classe `Personne`pour représenter soit un civil (statut = C) soit un espion (statut = E). 

2. Compléter cette classe avec la méthode `confrontation(autrePersonne)` qui renvoie le résultat d'une confrontation.

In [1]:
from random import randint, random

class Personne:
       
    def __init__(self,num,statut):
        self.statut = statut
        self.num = num
    
    def getStatut(self):  
        return self.statut
        
    def __str__(self):
        return 'P'+str(self.num)+' : '+self.getStatut()        
            
    def parole(self,p):
        if self.statut == 'C':  #pour son self statut on n'utilise pas getStatut (qui est utilisé pour autrui)
            return p.getStatut()
        else:
            return 'C' if random() < 0.5 else 'E'
        
class Inspecteur:
    
    def __init(self):
        pass
        
    def confrontation(self,pA, pB):
        '''confrontation(pA, pB) renvoie la confrontation (DA, DB)'''
        return (pA.parole(pB), pB.parole(pA))


In [2]:
p1 = Personne(1,'C')
p2 = Personne(2,'E')
p3 = Personne(3,'E')
gadget = Inspecteur()

gadget.confrontation(p1, p2), gadget.confrontation(p3, p2),

(('E', 'E'), ('E', 'C'))

3. Définir une fonction `generer_centre_recherche(n)` retournant une liste représentant un centre de recherche de $n$ personnes (bien relire les conditions) (si possible, faire en sorte que ni les civils ni les espions ne portent pas des n° consécutifs, et qu'ils ne se suivent pas dans la liste ...).

   Rappel : la fonction `shuffle` du module `random`permet de mélanger les éléments d'une liste.

In [3]:
from random import randint,random,shuffle

def generer_centre_recherche(n):                
    e = randint(1,(n-1)//2)
    lettres = ['E']*e + ['C']*(n-e)
    shuffle(lettres)
    centre_recherche = [Personne(i, lettres[i]) for i in range(n)]
    return centre_recherche

In [4]:
centre_recherche = generer_centre_recherche(10)
for p in centre_recherche:
    print(p)

P0 : C
P1 : C
P2 : C
P3 : E
P4 : C
P5 : C
P6 : C
P7 : E
P8 : E
P9 : C


## 2. Comment dénicher un civil ?


4. En supposant que l'inspecteur a réussi à identifier un civil, expliquer comment il peut identifier tous les espions. 
 
>Il suffit de confronter chacune des personnes au civil identifié, et de suivre ses déclarations ce qui nécessite $n - 1 $ confrontations,.

On se concentre donc maintenant sur le problème d'identifier un civil parmi les $n$ personnes (pour pouvoir identifier ensuite tous les espions).  

Nous allons étudier deux méthodes pour ce faire.

### 2.1. Première méthode : approche naïve.

5.	Imaginons un centre de recherche de 6 personnes (A, B, C, D, E et F) où les confrontations de A avec les autres ont donné les résultats suivants (les réponses de A étant sans importance): 
                                 
                                 ('?','C'), ('?','E'), ('?','C'), ('?','E') et ('?','C'). 

    a. Combien y a-t-il au moins de civils dans ce centre ?
> Comme le centre de recherche comporte plus de civils que d'espions, il y a au moins 4 civils dans ce centre.

   b. A est-il un civil ou un espion ?   
>Il y a donc au moins 3 civils parmi les 5 personnes B, C, D, E et F; les civils sont donc majoriatires et comme ils disent la vérité le statut de A est la réponse la plus fréquente (3 civils contre 2 espions) lors des confrontations de A avec les autres donc A est un civil.

   c. Et en enlevant F du centre, la réponse serait-elle la même ?
>Dans ce cas le centre comporterait 5 personnes dont au moins 3 civils; il y a donc au moins 2 civils parmi les 4 personnes B, C, D et E donc le statut de A sera donné correctement au moins par 2. Donc si un statut est majoritaire, c'est celui de A et s'il y a égalité (ce qui est le cas dans notre exemple), si A était un espion, les civils seraient majoritaires parmi B, C, D et E donc il n'y aurait pas égalité donc dans ce cas A est forcément un civil. 
>Donc finalement, A serait un civil.


6. Expliquer dans le cas général comment déterminer si une personne est un civil ou un espion.

>Il suffit donc de confronter cette personne aux $n - 1$ autres personnes. 
>Si au moins la moitié des personnes déclarent que c'est un civil, on peut conclure que c'est bien un civil et dans le cas contraire c'est un espion. 

7. 
   a. Ecrire une fonction `statut(centre,i)` qui prend en argument un centre et l'indice d'une personne et renvoie le statut de cette personne (après l'avoir confrontée aux autres). Tester.

In [5]:
def statut(centre,i):
    n = len(centre)
    ## on confronte la personne aux autres
    confrontations = []
    personne = centre[i]
    inspecteur = Inspecteur()
    for j in range(n):
        if j != i:
            confrontations.append(inspecteur.confrontation(personne, centre[j]))
    # on dépouille résultats
    c,e = 0,0
    for confrontation in confrontations:
        if confrontation[1] == 'C' : c+=1
        else : e += 1
    if c >= e : return 'C'
    else : return 'E'

In [6]:
centre_recherche = generer_centre_recherche(10)
for i in range(len(centre_recherche)):
    print(centre_recherche[i],end=' ')
    print('et identifié comme un',statut(centre_recherche,i))

P0 : C et identifié comme un C
P1 : E et identifié comme un E
P2 : C et identifié comme un C
P3 : E et identifié comme un E
P4 : C et identifié comme un C
P5 : C et identifié comme un C
P6 : C et identifié comme un C
P7 : E et identifié comme un E
P8 : C et identifié comme un C
P9 : C et identifié comme un C


   b. Ecrire une fonction `trouve_civil(centre)` qui permet de trouver un civil dans le centre. Tester.

In [7]:
def trouve_civil1(centre):
    n = len(centre)
    i = 0
    while statut(centre,i) == 'E' and i < n:
        i += 1
    return centre[i]

In [8]:
centre_recherche = generer_centre_recherche(10)
for i in range(len(centre_recherche)):
    print(centre_recherche[i])
print()
print(trouve_civil1(centre_recherche))

P0 : E
P1 : E
P2 : E
P3 : C
P4 : C
P5 : C
P6 : E
P7 : C
P8 : C
P9 : C

P3 : C


8.	Combien faut-il dans le pire des cas organiser de confrontations pour parvenir à identifier tous les espions d'un centre de $n$ personnes avc cette méthode ?

>La fonction `status` néccesite $n-1$ confrontations et la fonction `trouve_civil` appelera au plus $\frac{n}{2} $ fois la fonction `status` pour trouver un civil donc il faut au plus $\frac{n(n-1)}{2}$ confrontations pour parvenir à trouver un civil (donc compléxité quadratique).

### 2.2. Deuxième méthode : approche diviser pour régner.

On considère maintenant l'algorithme suivant (**pour trouver un civil**) :
-	Si n = 1 ou n = 2, toutes les personnes sont des civils (puisqu'il y a strictement plus de civils que d'espions).
-	Si n est impair, on choisit au hasard une personne, et on utilise la méthode de la question 2 pour déterminer si cette personne est un civil ou un espion :
   *	Si c'est un civil, on a résolu le problème.
   *	Sinon, on élimine cette personne. On résout alors récursivement le problème pour les n-1 personnes restantes, sachant que n-1 est pair.
-	Si n est pair, on sépare les personnes en deux files de m = n/2 personnes, et on fait se confronter les premiers de chaque file, puis les deux seconds et ainsi de suite. Pour chaque confrontation :
   *	Si les deux personnes se déclarent l'une l'autre comme civil, on en élimine une des deux.
   *	Sinon, on élimine les deux.
   
  Une fois les $m$ confrontations réalisées, on résout récursivement le problème pour les personnes restantes (remarquons qu'il y en a au plus $m$ donc on aura diviser la taille du problème au moins par 2).

Lors d'un appel récursif de la méthode diviser pour régner, notons P l'ensemble initial de personnes et P' l'ensemble de personnes qui n'ont pas été éliminées. On sait qu'il y a strictement plus de civils que d'espions dans P. Pour montrer que l'algorithme est correct, on va montrer qu'il y a toujours strictement plus de civils que d'espions dans P'.

9.	Soit $n$ le nombre de personnes dans P. On suppose que $n$ est impair, et que la personne choisie au hasard n'est pas un civil. 

   Expliquer pourquoi il y a plus de civils que d'espions dans P'.
   
>On a seulement éliminé une personne en sachant que c'était un espion, on a donc réduit le nombre d'espions, sans changer celui de civils, et on a donc toujours plus de civils que d'espions !

On suppose dans la question qui suit que le nombre n de personnes dans P est pair, et on considère l'ensemble des m = n/2 confrontations induites par les deux files (les confrontations entre deux personnes au même rang dans les files). 

Soit :
-	*ee* le nombre de confrontations dans lesquelles deux espions s'affrontent (on parle ici du vrai statut des personnes, et non des déclarations),
-	*cc* le nombre de confrontations dans lesquelles deux civils s'affrontent,
-	*ce* le nombre de confrontations dans lesquelles un civil et un espion s'affrontent.

On a bien sûr *ee + cc + ce = m*. 

Etant donné un ensemble X de personnes, on notera c(X) le nombre de civils dans X, et e(X) le nombre d'espions dans X.

10.	L'objet de la question est de montrer qu'il y a nécessairement plus de civils que d'espions dans P'.
  
     a.	Donner l'expression de e(P) en fonction de *ce* et *ee*, et l'expression de c(P) en fonction de *ce* et *cc*.
>On a c(P) = 2cc + ce et e(P) = 2ee + ce.
   
   b. Montrer que cc > ee.
>On sait que c(P) = 2cc +ce et e(P) = 2ee +ce. 
>Or on sait aussi que c(P) > e(P) donc 2cc + ce > 2ee + ce d'où cc > ee.
   
   c.	Montrer que c(P') > e(P').
>On a c(P') = cc et e(P') ≤ ee (on garde un espion par confrontation entre espions qui se déclarent mutuellement civils). 
>Donc, puisque cc > ee, c(P') > e(P').

Les questions 9 et 10 prouvent que s’il y a plus de civils que d'espions dans P, alors cela restera vrai dans P'. Ainsi, lorsqu'il ne restera plus qu'une ou deux personnes dans P', ces personnes seront bien des civils. Cet algorithme est donc bien valide.

11.   

a. Ecrire une fonction `elimination(f1,f2)` qui prend en arguments deux files (en fait deux listes) de personnes et renvoie l'ensemble des personnes sélectionnées après confrontation 2 à 2 des personnes selon le protocole décrit précédemment.

In [19]:
def elimination(f1,f2):
    m = len(f1)
    reste = []
    inspecteur = Inspecteur()
    for i in range(m):
        p1,p2 = f1[i],f2[i]
        if inspecteur.confrontation(p1, p2) == ('C','C'):
            reste.append(f1[i] if random() < 0.5 else f2[i])
    return reste

b. Ecrire une fonction `trouve_civil(centre)` qui permet de trouver un civil dans le centre en appliquant la méthode décrite précédemment.
      

In [20]:
def trouve_civil2(centre):
    n = len(centre)
    if n <= 2: # dans ce cas que des civils
        return centre[randint(0,n-1)] # on renvoie un civil au hasard
    elif n%2 == 1: # cas impair
        i = randint(0,n-1)
        if statut(centre,i) == 'C':
            return centre[i]
        else :
            centre_aux = centre[:]
            del centre_aux[i]
            return trouve_civil2(centre_aux)
    else: # cas pair
        m = n//2
        f1,f2 = centre[:m],centre[m:]
        centre_aux = elimination(f1,f2)
        return trouve_civil2(centre_aux)

In [21]:
centre_recherche = generer_centre_recherche(11)
for i in range(len(centre_recherche)):
    print(centre_recherche[i])
print()
print(trouve_civil2(centre_recherche))

P0 : E
P1 : C
P2 : E
P3 : C
P4 : E
P5 : C
P6 : C
P7 : C
P8 : C
P9 : E
P10 : E

P1 : C


## 3. Et maintenant débusquons les espions !



12. Ecrire enfin une fonction `debusque_espions(centre)` qui permet de trouver les espions se cachant dans le centre.

    Proposer 2 versions : une utilisant la première version de `trouve_civil` et une autre la deuxième version.

 

In [22]:
def debusque_espions1(centre):
    n = len(centre)
    espions = []
    inspecteur = Inspecteur()
    civil = trouve_civil1(centre)
    for j in range(n):
        if inspecteur.confrontation(civil, centre[j])[0] == 'E':
            espions.append(j)
    return espions

In [23]:
def debusque_espions2(centre):
    n = len(centre)
    espions = []
    inspecteur = Inspecteur()
    civil = trouve_civil2(centre)
    for j in range(n):
        if inspecteur.confrontation(civil, centre[j])[0] == 'E':
            espions.append(j)
    return espions

In [26]:
print('Voici le centre : ')
n = 15
centre_recherche = generer_centre_recherche(n)
for i in range(len(centre_recherche)):
    print(centre_recherche[i])
print()
espions = debusque_espions2(centre_recherche)   
print('Voici (avec la première méthode) démasqués les',len(espions),'espion(s) qui se dissimulai(en)t dans ce centre : ')
for i in range(len(espions)):
    print(centre_recherche[espions[i]])
print()
espions = debusque_espions2(centre_recherche)   
print('Voici (avec la deuxième méthode) démasqués les',len(espions),'espion(s) qui se dissimulai(en)t dans ce centre : ')
for i in range(len(espions)):
    print(centre_recherche[espions[i]])
print()

Voici le centre : 
P0 : E
P1 : C
P2 : C
P3 : C
P4 : C
P5 : C
P6 : E
P7 : C
P8 : E
P9 : E
P10 : C
P11 : C
P12 : C
P13 : E
P14 : C

Voici (avec la première méthode) démasqués les 5 espion(s) qui se dissimulai(en)t dans ce centre : 
P0 : E
P6 : E
P8 : E
P9 : E
P13 : E

Voici (avec la deuxième méthode) démasqués les 5 espion(s) qui se dissimulai(en)t dans ce centre : 
P0 : E
P6 : E
P8 : E
P9 : E
P13 : E



##### 4. Comparaison des 2 méthodes (pour `trouve_civil`)  en terme de complexité

13.	Faire tourner le code ci-desous (si attente trop longue, remplacer 7 par 6 ...). Que peut-on en déduire ?

In [28]:
from time import perf_counter

for i in range(1,7):
    n = 10**i
    centre_recherche = generer_centre_recherche(n)
    top1 = perf_counter()
    trouve_civil1(centre_recherche)  
    top2 = perf_counter()
    trouve_civil2(centre_recherche)  
    top3 = perf_counter()
    print('n = {} : méthode naive: {} - méthode diviser pour régner: {}'.format(n,top2-top1,top3-top2))

n = 10 : méthode naive: 4.999999998744897e-05 - méthode diviser pour régner: 3.0599999945479794e-05
n = 100 : méthode naive: 0.00017969999998967978 - méthode diviser pour régner: 0.0001750999999785563
n = 1000 : méthode naive: 0.0018019000000322194 - méthode diviser pour régner: 0.0015481000000363565
n = 10000 : méthode naive: 0.01919050000003608 - méthode diviser pour régner: 0.011518000000023676
n = 100000 : méthode naive: 0.3607407999999168 - méthode diviser pour régner: 0.20370690000004288
n = 1000000 : méthode naive: 7.787799199999995 - méthode diviser pour régner: 1.6351859000000104


On constate que le deuxième algorithme est un peu plus efficace (plus rapide) que le premier.

On peut prouver - mais ça dépasse le cadre de ce cours que le deuxième a - en terme de confrontations - une complexité en $O(n)$  donc linéaire alors que le premier, comme nous l'avons vu, a une complexité en $O(n^2)$ ie quadratique.