In [None]:
%run ../src/game.py
%run ../src/ipd.py
%run ../src/strategies.py
%run ../src/tools.py
dip =[(3,3),(0,5),(5,0),(1,1)]   # Dilemme du prisonnier


## Tests d'équivalence de stratégies

Les ensembles de stratégies que nous traitons sont parfois redondants : il contiennent les mêmes stratégies écrites de différentes manières. Il semble donc interessant de pouvoir simplifier des ensembles de stratégies en suprimant les doublons qu'ils peuvent contenir. 
Malheureusement, chacun le sait depuis Turing, l'équivalence de deux programmes est indécidable. Il n'y a donc pas de test parfait. Il est néanmoins possible de fournir des outils permettant d'avancer dans ce problème de simplification.


Pour savoir si deux stratégies sont différentes, il suffit de les faire jouer contre une stratégie de référence et s'assurer qu'elles jouent différemment face à cet adversaire. Evidemment selon la complexité de cette stratégie de référence, le test est plus ou moins efficace. Si les stratégies jouent la même chose, cela ne fournit néanmoins pas une preuve de leur équivalence. L'équivalence est semi-décidable : si les stratégies jouent différemment il est sûr qu'elles sont différentes, mais si elles jouent de manière identique, c'est peut-etre que la stratégie de référence n'a pas sû révéler leur différence de comportement.
La fonction `testEquivUnit` réalise ce test. On lui passe un couple de stratégies à tester et une stratégie de référence `opponent`, et elle compare ces deux stratégies durant `length` tours d'un meeting. Elle renvoie un booléen : équivalent (avec doute) ou pas.

In [None]:
def testEquivUnit(strategies, opponent, length):
    sA,sB = strategies
    rounds1 = []
    rounds2  = []
    m1 = Meeting(g, sA, opponent, length)
    m1.run()
    m2 = Meeting(g, sB, opponent, length)
    m2.run()
    if m1.s1_score == m2.s1_score :
        if m1.s1_rounds == m2.s1_rounds :
            return True
    return False

print(testEquivUnit((Tft(), Spiteful())  , Periodic("CCDCD"), 100))
print(testEquivUnit((Tft(), Mem(0,1,"cCD")),  Periodic("CCDCD"), 100))



## Exercice 1

Deux stratégies peuvent bien évidemment obtenir le même score face à un adversaire commun,tout en ayant joué des coups différents. Pouvez vous identifier un tel cas ? On pourra utiliser le package `itertools` et sa méthode `permutations` qui permet facilement de prendre 3 stratégies parmi n

In [None]:
def test2(strategies, opponent, length):
    sA,sB = strategies
    rounds1 = []
    rounds2  = []
    m1 = Meeting(g, sA, opponent, length)
    m1.run()
    m2 = Meeting(g, sB, opponent, length)
    m2.run()
    if m1.s1_score == m2.s1_score :
        if m1.s1_rounds != m2.s1_rounds :  # THE TEST HAS CHANGED COMPARED TO testEquivUnit
            return True
    return False


bag = getMem(1,0)
bags = itertools.permutations(bag, 3)
for b in bags : 
    if test2((b[0], b[1]), b[2], 10):
        print(b[0].name + " and "+b[1].name+" produce the same score but don't play the same rounds against : "+b[2].name)            
        break

        
        
#sA = Mem(1,1,"CCCCC")
#sB = Mem(1,1,"CCDDC")
#opponent = Mem(1,1,"DCDCC")
#m = Meeting(g,sA,opponent,10)
#m.run()
#print(m.s1.name + "\t" + ' '.join(map(str, m.s1_rounds)) + " " + str(m.s1_score))
#print(m.s2.name + "\t" + ' '.join(map(str, m.s2_rounds)) + " " + str(m.s2_score))
#print()
#m = Meeting(g,sB,opponent,10)
#m.run()
#print(m.s1.name + "\t" + ' '.join(map(str, m.s1_rounds)) + " " + str(m.s1_score))
#print(m.s2.name + "\t" + ' '.join(map(str, m.s2_rounds)) + " " + str(m.s2_score))

Le choix de la stratégie de référence est capital. Si elle est trop "faible", elle ne permet pas aux deux stratégies comparées de se "révéler" et indique alors qu'elles sont équivalentes alors qu'elles ne le sont pas, comme ci-dessous : `Tft` et `Spiteful` sont clairement différentes, et pourtant, face  `All_C` elles ont le même comportement.


In [None]:
testEquivUnit((Tft(), Spiteful()), Periodic('C'), 100)

Un test plus robuste pourrait être de les faire jouer contre `Periodic('CCD')`. Cette dernière permet à Tft et Spiteful de révéler leeur véritable comportement. On a cette fois ci la preuve que ces deux stratégies ne sont pas équivalentes.

In [None]:
testEquivUnit((Tft(), Spiteful()), Periodic('CD'), 100)

Afin d'améliorer cette comparaison de deux stratégies, il est préférable de les comparer non pas à une seule stratégie de référence, mais à un ensemble de stratégies de référence. On compare nos deux stratégies contre chaque élément de cet ensemble, ce qui constitue un test surement plus robuste. Bien évidemment dès que l'une de celles-ci indique une différence entre deux 2 stratégies, le test peut s'arrêter.
La fonction `testEquivMultiple` fonctionne comme précédemment, mais cette fois en cherchant à trouver une différence de comportement grâce à une liste d'opposants. Comme précédemmnt elle renvoie un booléen : équivalent (avec doute) ou pas.

In [None]:
def testEquivMultiple(strategies, opponents, length):
    for opponent in opponents : 
        equiv = testEquivUnit(strategies, opponent, length)
        if equiv == False :
            return False
    return True

testEquivMultiple((Tft(), Spiteful()),[Periodic('CDCCDDC'), Periodic('DDCDCDD')], 10)

Pour simplifier un ensemble de stratégies, il suffit maintenant d'effectuer le test précédent sur tous les couples possibles. Les stratégies identifiées comme potentiellement équivalentes sont alors regroupées.
la fonction `classesEquiv(l, opponents, length)` effectue ce test sur l'ensemble `l`. Elle renvoie dans un dictionnaire les classes d'équivalence identifiées.
Par exemple si on a strat1 équivalente à strat2 ainsi que strat3 qui elle n'a pas d'équivalente, la fonction va renvoyer un dictionnaire : `{strat1 : [strat2] , strat3 : []}`

L'ensemble des clés de ce dictionnaire constitue l'ensemble de stratégies simplifié, et chaque entrée du dictionnaire correspond à un ensemble de stratégies équivalentes. Les génomes étants parfaitement symétriques, le nombre de stratégies équivalentes est toujours une puissance de 2 (0, 2, 4, 8, 16 ...)

In [None]:
def classesEquiv(l, opponents, length):
    m = dict()
    while len(l) > 0 :
        m[l[0]] = []
        ind = [0]
        for j in range(len(l[1:])):
            if testEquivMultiple([l[0], l[j + 1]], opponents, length):
                m[l[0]] += [l[j + 1]]
                ind += [j + 1]
        ltmp = []
        for i in range(len(l)):
            if i not in ind :
                ltmp += [l[i]]
        l = ltmp
    return m


# This function allows you to display the names of the strategies instead of the instance number.
def printDict(ce):
    for key in ce.keys() :
        if len(ce[key]) > 0:
            print("\n" + key.name + " : " , end =" " )
        else :
            print("\n"+ key.name + ": []"  , end =" ")
        for value in ce[key]:
            print(value.name , end =" ")
    print(" ")
    
    
L = [Tft(), Spiteful(), Mem(0,1,"cCD"),  Mem(1,1,"cCDDD"), Periodic("CDC") ]
ce = classesEquiv(L, [Periodic('CDCCDDC'), Periodic('DDCDCDD')], 10)
printDict(ce)
print("Simplified set size : " + str(len(ce.keys())))

On rappelle que la qualité de cette simplification dépend très fortement de la qualité de la liste de référence. On le constate aisément en tentant de simplifier `mem(1,2)` face à une liste de plus en plus grande de stratégies de référence.


In [None]:
# Mem(1,2) contains 1024 strategies

# Without any opponent, they are all considered equivalent.
ce = classesEquiv(getMem(1,2), [], 10)
print(len(ce.keys()))

# Comparing with simply ALL_C , only 9 different strategies are available
ce = classesEquiv(getMem(1,2), [Periodic('C')], 10)
print(len(ce.keys()))

# We're gradually strengthening the test
ce = classesEquiv(getMem(1,2), [Periodic('C'), Periodic('CDCCDDC'), Periodic('DDCDCDD')], 10)
print(len(ce.keys()))

ce = classesEquiv(getMem(1,2), [Periodic('C'), Periodic('CDCCDDC'), Periodic('DDCDCDD'),Gradual()], 10)
print(len(ce.keys()))

# So? How large is this simplified set really?


On peut encore renforcer le test en commençant par faire jouer toutes les stratégies de l'ensemble à tester entre elles. Bien évidemment si des stratégies sont identiques, elles doivent avoir le même score dans ce tournoi. On peut donc se contenter de tester les équivalences sur les ensembles de stratégies qui obtiennent en Tournoi un score identique. Rajouter cette équivalence des scores renforce encore un peu plus notre test.
Bien évidemment ceci se fait au détriment du temps de calcul.
La fonction `simplify` effectue ce travail. Elle fonctionne comme précédemment mais démarre par un tournoi afin d'identifier les paquets de stratégies ayant le même score. On concatène ensuite chacun des dictionnaires

In [None]:
def simplify(l, opponents, length):
    scores = dict()
    t = Tournament(g, opponents + l, length)
    t.run()
    res = t.matrix['Total']
    for strat in l : 
        score = res[strat.name]
        if score not in scores :
            scores[score] = [strat]
        else : 
            scores[score] += [strat]
    
    d = dict()
    for item in scores.values():
        # if more than one strategy has the same score, test classesEquiv
        if len(item) > 1 :
            res = classesEquiv(item, opponents, length)
            for it in res.keys():
                d[it] = res[it]
        else : 
            d[item[0]] = []
    return d

        
    
        
strats = simplify(getMem(1,2) , [Periodic('C'), Periodic('CDCCDDC'), Periodic('DDCDCDD'),Gradual()], 10)
print("Simplified set size : " + str(len(strats)))

# # RECORD BROKEN! 820... but this test remains undecidable, it is nevertheless subject to a doubt... 
        
# printDict(strats)  

### Tableau de synthèse

Etant donnée une base de comparaison, réaliser un tableau contenant pour chacune des classes de Memory classiques, la synthèse des tailles obtenues après simplication via ClassesEquiv et via Simplify 

In [None]:
base  = [Periodic('CDCCDDC'), Periodic('DDCDCDD'),Gradual()]

Mem01 = getMem(0,1)
Mem10 = getMem(1,0)
Mem11 = getMem(1,1)
Mem12 = getMem(1,2)
Mem21 = getMem(2,1)

ce01 = classesEquiv(Mem01, base, 10)
ce10 = classesEquiv(Mem10, base, 10)
ce11 = classesEquiv(Mem11, base, 10)
ce12 = classesEquiv(Mem12, base, 10)
ce21 = classesEquiv(Mem21, base, 10)

simp01 = simplify(Mem01, base, 10)
simp10 = simplify(Mem10, base, 10)
simp11 = simplify(Mem11, base, 10)
simp12 = simplify(Mem12, base, 10)
simp21 = simplify(Mem21, base, 10)

# idem avec simplify

tab = pd.DataFrame(
        np.nan, ["Mem 0 1","Mem 1 0","Mem 1 1", "Mem 1 2", "Mem 2 1"], ["All strategies", "After classesEquiv","After simplify"]
    )
tab.at["Mem 0 1", "All strategies" ] = len(Mem01)
tab.at["Mem 1 0", "All strategies" ] = len(Mem10)
tab.at["Mem 1 1", "All strategies" ] = len(Mem11)
tab.at["Mem 1 2", "All strategies" ] = len(Mem12)
tab.at["Mem 2 1", "All strategies" ] = len(Mem21)
tab.at["Mem 0 1", "After classesEquiv" ] = len(ce01.keys())
tab.at["Mem 1 0", "After classesEquiv" ] = len(ce10.keys())
tab.at["Mem 1 1", "After classesEquiv" ] = len(ce11.keys())
tab.at["Mem 1 2", "After classesEquiv" ] = len(ce12.keys())
tab.at["Mem 2 1", "After classesEquiv" ] = len(ce21.keys())
tab.at["Mem 0 1", "After simplify" ] = len(simp01.keys())
tab.at["Mem 1 0", "After simplify" ] = len(simp10.keys())
tab.at["Mem 1 1", "After simplify" ] = len(simp11.keys())
tab.at["Mem 1 2", "After simplify" ] = len(simp12.keys())
tab.at["Mem 2 1", "After simplify" ] = len(simp21.keys())
tab

## Améliorer l'affichage des stratégies

Les classes d'équivalence permettent de mettre en évidence des ensembles de stratégies qui jouent de manière identique. Par construction, ces stratégies identiques ont une partie de leur génotype en commun.
Il est alors interessant d'afficher les ensembles de stratégies équivalentes par une seule et même représentation en remplaçant les coups qui ne sont pas impactant par des *
On passe à cette méthode un ensemble de stratégies idétifiées comme équivalentes, la méthode fusionne ces noms pour fournir une notation avec *. Attention : cette méthode ne vérifie pas l'équivalence, elle ne s'occupe que de la notation

In [None]:
def computeStar(strategies):
    l = math.log2(len(strategies))
    assert l == int(l)
    ind_stars = []
    len_genome = len(strategies[0].genome)
    for i in range(len_genome):
        letter = strategies[0].genome[i]
        for j in range(1, len(strategies)):
            if letter != strategies[j].genome[i]:
                ind_stars += [i]
                break
    assert len(ind_stars) == l
    new_genome = ""
    for i in range(len_genome):
        if i not in ind_stars:
            new_genome += strategies[0].genome[i]
        else :
            new_genome += "*"
    #print(new_genome)
    return new_genome
            
print(computeStar([Mem(1,1,"CDCD"),Mem(1,1,"CDCC")]))
print(computeStar([Mem(1,2,"CDCDCDDDCC"),Mem(1,2,"CDCDDDDDCC"),Mem(1,2,"CDDDCDDDCC"),Mem(1,2,"CDDDDDDDCC")]))
      

## Comparer une classe complète et sa classe simplifiée

Nous avons maintenant tous les outils permettant, non seulement de simplifier une classe, de rejouter cette classe simplifier, et de comparer les résultats.
Prenons l'exemple des Mem(1,1). Cette classe contient 32 stratégies. Une fois simplifiée il en reste 26. On constate que les deux compétitions écologiques donnent les mêmes 4 premiers. On note que dans la classe simplifiée les All_C survivent, alors qu'elles disparaissent dans la classe complète.

In [None]:
mem11 = getMem(1,1)
simpl = simplify(mem11, [Periodic('CDCCDDC'), Periodic('DDCDCDD')], 10)
print(len(simpl))

bag = []
for key in simpl.keys():
    if len(simpl[key]) > 0:
        name = computeStar([key]+simpl[key])
        bag += [key.clone(name)]
    else :
        bag += [key]

e1 = Ecological(g, mem11)
e1.run()

evol=e1.historic
nbSurvivors = len(evol.iloc[-1][evol.iloc[-1]>0])
e1.drawPlot(None,nbSurvivors)


e2 = Ecological(g, bag)
e2.run()

evol=e2.historic
nbSurvivors = len(evol.iloc[-1][evol.iloc[-1]>0])
e2.drawPlot(None,None)


# On constate qu'avec mem(1,1) on passe de 32 stratégies à 26 stratégies
# On constate aussi que la compétition des simplifiées donne le même classement excepté 
# le fait que ALL_C survit dans la version simplifiée

# Une approche incrémentale

Pour savoir si une stratégie peut être notée avec des étoiles, il faut savoir si elle utilise tous les éléments de son code. Si ce n'est pas le cas on repère ces éléments et on les remplace par des étoiles. Une étoile indique que ce gène peut être remplacé par n'importe quelle valeur puisqu'il ne sert pas.
La fonction `getGenericName` prend pour agrument un génotype de stratégie de type Memory et qui renvoie ce génotype éventuellement réécrit avec des *
L'idée générale de l'algorithme utilisé consiste à construire peu à peu la liste de tous les passés possibles, et donc, de mettre des étoiles pour les passés qui n'apparaissent pas dans cette liste.

In [None]:
def getGenericName(X,Y,genotype):
    me = genotype[max(X,Y)-1].upper()
    #print(me)
    opponent=""
    L = [x for x in itertools.product(['C', 'D'],repeat=Y)]
    L = [list(elem) for elem in L]
    #print(L)
    
    L1 = [x for x in itertools.product(['C', 'D'],repeat=X+Y)]
    L1 = [list(elem) for elem in L1]
    
    possiblePast = []
    for elem in L :
        possiblePast += [[me]+elem] 
    #print(possiblePast)
    lenpossiblePast = len(possiblePast)
    for i in range(lenpossiblePast):
        past = possiblePast[i][2]
        a = genotype[L1.index(possiblePast[i])+max(X,Y)].upper()
        past1 = [a, past, 'C']
        past2 = [a, past, 'D']
        if past1 not in possiblePast :
            possiblePast += [past1]
        if past2 not in possiblePast :
            possiblePast += [past2]
   
    #print(possiblePast)
    
    
    ind=[]
    for i in range(len(L1)):
        if L1[i] not in possiblePast:
            ind += [i]
    
    genotypeStar = genotype[0 : max(X,Y)]
    for i in range(len(L1)):
        if i not in ind : 
            genotypeStar += genotype[max(X,Y) + i]
        else :
            genotypeStar += "*"
    
    return genotypeStar


print(getGenericName(1,2,"ccCCDDCCDD"))
# ccCCDDCCDD

print(getGenericName(1,2,"ccCCCCCCCC"))
# ccCCCC****


Ce résultat est important : il montre que, bien que la comparaison de 2 programmes soit indécidable dans le cas général, elle est néamoins décidable dans le cas des `Mem(X,Y)`.

Il reste maintenant à utiliser cette fonction pour simplifier un ensemble de stratégies : on prend l'ensemble de tous les noms possibles, on parcourt la liste nom par nom, on remplace chaque nom par son nom générique et on enlève de la liste tous ses semblables. On note qu'aucun tournoi ni aucune rencontre n'est nécessaire pour simplifier une classe !

## Verification
Afin de vérifier le bon fonctionnement de nos différents algorithmes, nous avons tous les outils pour comparer le résultat obtenu avec l'approche exacte (`getGenericName`) et le résultat obtenu par l'équivalence approximative(`simplify` ou `classesEquiv` ,suivi de `computeStar`).
Pour cela on prend une classe (Mem(1,2) par exemple), on calcule ensuite ses classes d'équivalence. Pour chaque classe non vide, on vérifie que getGenericName sur la clé correspond bien à l'ensemble des stratégies de cette classe d'équivalence (en nombre en comptant les étoiles, ou en qualité en appliquant `computeStar` à l'ensemble de la classe).

## Simplification d'un ensemble par la méthode exacte

In [None]:
def simplifyExact(bag, X, Y):
    res = set()
    simplified = []
    for strat in bag : 
        gName = getGenericName(X,Y,strat.genome)
        if gName not in res:
            res.add(gName)
            simplified += [strat]
    return simplified

In [None]:
simplified = simplifyExact(getMem(1,2),1 ,2)
print("Lenght of bag simplified : {}".format(len(simplified)))

METTRE UN TITRE ICI

In [None]:
def trie_Mem1(strategies):
    strategies.sort(key=lambda x: x.genome)
    return strategies

def trie_Mem2(strategies):
    strategies.sort(key=lambda x: x.genome, reverse=True)
    return strategies

def trie_Mem3(strategies):
    strategies.sort(key=lambda x: ''.join(reversed(x.genome)))
    return strategies

def trie_Mem4(strategies):
    strategies.sort(key=lambda x: ''.join(reversed(x.genome)), reverse=True)
    return strategies


sortMem11 = trie_Mem4(getMem(1,1))


In [None]:
def rec_simplify(l, opponents, length, batchSize):
    size = len(l)
    strats = []
    simplified = dict()
    for i in range(int(size/batchSize)):
        strats += l[i * batchSize : (i+1) * batchSize]
        res = simplify(strats, opponents, length)
        #print("len de res : {}".format(len(res)))
        print("{} strategies deleted".format(len(strats) - len(res)))
        for strat in res.keys() :
            if strat not in simplified : 
                simplified[strat] = res[strat]
            else : 
                simplified[strat] += res[strat]
        strats = list(simplified.keys())
        #print("len strats  : {}".format(len(strats)))
    #print("len strats final : {}".format(len(strats)))
    return simplified


        
# print(rec_simplify([Tft(), Spiteful(), Mem(0,1,"cCD"),  Mem(1,1,"cCDDD"), Periodic("CDC"), Periodic('C') ], [Periodic('CCD'), Periodic('DDC')] , 10, 2))
# print(" ")
# sortMem12 = trie_Mem(getMem(1,2))
# rec_simplify(sortMem12, [Periodic('CCD'), Periodic('DDC')] , 10, 32)

Petite vérification

In [None]:
res_rec = rec_simplify(getMem(1,2), [Periodic('CCD'), Periodic('DDC')] , 10, 1024)
res = simplify(getMem(1,2), [Periodic('CCD'), Periodic('DDC')], 10)
print(len(res_rec) == len(res))

In [None]:
res_rec = rec_simplify(getMem(1,2), [Periodic('CCD'), Periodic('DDC')] , 10, 512)
res = simplify(getMem(1,2), [Periodic('CCD'), Periodic('DDC')], 10)
print(len(res_rec) == len(res))
print(len(res_rec))
print(len(res))

# Des classes de stratégies

Quand on regarde un ensemble de stratégie on constate qu'elle possèdent des caractéristiques générales qui permettent de les ranger en différentes classes. Les quatre sous-classes que nous considérons sont la classe des stratégies initialement coopératives IC (elle ne prend jamais l’initiative de trahir); la classe complémentaire à IC qui est celle des stratégies "spontanément agressives", SA (toute stratégie est donc soit IC soit SA); la classe des stratégies initialement agressives IA (elle ne prend jamais l’initiative de coopérer); la classe complémentaire à IA qui est celle des stratégies "spontanément coopératives" SC (toute stratégie est donc soit IA soit SC). On note que toute stratégie IA est SA et que toute strategie IC est SC.

In [None]:
m = Meeting(g, Periodic('D'), Periodic('D'), 100)
m.run()
print(m.s1_score)

In [None]:
def getAgressivityClasses(bag):
    aggressivity = {'IC':[], 'SC':[],'IA':[],'SA':[]}
    for strat in bag : 
        m1 = Meeting(g, strat, Periodic('C'), 100)
        m1.run()
        m2 = Meeting(g, strat, Periodic('D'), 100)
        m2.run()
        if m1.s1_score == 300:
             aggressivity['IC'] += [strat.name]
        if m1.s1_score > 300:
             aggressivity['SA'] += [strat.name]
        if m2.s1_score == 100:
             aggressivity['IA'] += [strat.name]
        if m2.s1_score < 100:
             aggressivity['SC'] += [strat.name]
    return aggressivity
        
    
print(getAgressivityClasses(getClassicals()))
        
        

L'aggressivité des stratégies avant et après simplification

In [None]:
def createTab(bag):
    agr = getAgressivityClasses(bag)
    simplified = simplify(bag, [Periodic('CDCCDDC'), Periodic('DDCDCDD')], 10)
    agrS = getAgressivityClasses(simplified)
    tab = pd.DataFrame(
            np.nan, ["IC","SC","IA", "SA"], ["Before simplify","After simplify"]
        )
    for key in agr :
        tab.at[key,"Before simplify" ] = len(agr[key])
    for key in agrS :
        tab.at[key, "After simplify"] = len(agrS[key])
    return tab

createTab(getMem(1,1))


Maintenant, regardons avec Mem(1,2)

In [None]:
createTab(getMem(1,2))

Quel est le classement moyen des stratégies de chaque classe ?

In [None]:
bag = getMem(1,1)
compterEcolo(bag)
getAgressivity(bag)
print("moyenne des IC")
Comment on fait pour avoir moyenne des rangs et des scores de chaque classe ?