In [19]:
import json
from math import tanh
import random


def data_équipes_dict():
    équipes = {}
    with open("data_équipes.csv", "r", encoding="utf8") as f_data_equipes:
        data_equipes = [line.strip().split(";") for line in f_data_equipes][1:]
    for e in data_equipes:
        équipe = {}
        équipe["gardiens"] = json.loads(e[1])
        équipe["défenseurs"] = json.loads(e[2])
        équipe["milieux"] = json.loads(e[3])
        équipe["attaquants"] = json.loads(e[4])
        équipes[e[0]] = équipe
    
    return équipes


def data_joueurs_dict(data_csv):
    with open(data_csv, "r", encoding="utf8") as f_data_joueurs:
        data_joueurs = [line.strip().split(",") for line in f_data_joueurs][1:]

    joueurs = {}
    for j in data_joueurs:
        joueur = {}
        joueur["nationalité"] = j[1]
        joueur["rating"] = j[2]
        joueur["âge"] = j[3]
        joueurs[j[0]] = joueur
        
    return joueurs

équipes = data_équipes_dict()
joueurs = data_joueurs_dict("data_joueurs_new.csv")
    
class Match:
    def __init__(self, A, B):
        self.A = A
        self.B = B
        self.rating_A = sum([j.rating for j in self.A]) / len(self.A)
        self.rating_B = sum([j.rating for j in self.B]) / len(self.B)
        
        
    def play(self):
        coeff = 25
        diff = (self.rating_B - self.rating_A) / coeff
        return (1 - tanh(diff)) / 2

In [70]:
def liste_classement_équipes():
    with open("classement_équipes.csv", "r", encoding="utf8") as f:
        l = [[line.strip().split(",")[0], float(line.strip().split(",")[1])] for line in f]
        return {k:v for k, v in l}
        

{'Qatar': 70.81818181818181,
 'Equateur': 73.81818181818181,
 'Sénégal': 78.81818181818181,
 'Pays-Bas': 83.36363636363636,
 'Angleterre': 84.81818181818181,
 'Iran': 73.54545454545455,
 'Etats-Unis': 76.45454545454545,
 'Pays de Galles': 73.63636363636364,
 'Argentine': 83.63636363636364,
 'Arabie saoudite': 71.45454545454545,
 'Mexique': 78.18181818181819,
 'Pologne': 78.9090909090909,
 'France': 84.27272727272727,
 'Australie': 72.72727272727273,
 'Danemark': 80.0,
 'Tunisie': 72.63636363636364,
 'Espagne': 83.9090909090909,
 'Costa Rica': 73.45454545454545,
 'Allemagne': 85.36363636363636,
 'Japon': 75.72727272727273,
 'Belgique': 82.9090909090909,
 'Canada': 74.0909090909091,
 'Maroc': 79.36363636363636,
 'Croatie': 81.63636363636364,
 'Brésil': 84.54545454545455,
 'Serbie': 79.72727272727273,
 'Suisse': 79.0909090909091,
 'Cameroun': 75.27272727272727,
 'Portugal': 84.9090909090909,
 'Ghana': 76.9090909090909,
 'Uruguay': 81.0909090909091,
 'Corée du Sud': 75.0909090909091}

In [155]:
def match(A, B, affichage=False):
    l = liste_classement_équipes()
    rating_A = l[A]
    rating_B = l[B]
    
    coeff = 25
    diff = (rating_B - rating_A) / coeff
    proba_A =  (1 - tanh(diff)) / 2
    proba_B = 1 - proba_A
    r = random.random()
    
    if r > proba_B:
        if affichage:
            print(f"`{A} à gagné avec un proba de {proba_A}")
        return A
    else:
        if affichage:
            print(f"{B} à gagné avec un proba de {proba_B}")
        return B

In [169]:
h = {}
nb = 100
for i in range(nb):
    m = match("France", "Qatar")
    h[m] = h.get(m, 0) + 1

0.7458052186692676 0.25419478133073237 0.447172106250862
0.7458052186692676 0.25419478133073237 0.6438600915974408
0.7458052186692676 0.25419478133073237 0.14292263749089384
0.7458052186692676 0.25419478133073237 0.5713506893348499
0.7458052186692676 0.25419478133073237 0.6380048194573096
0.7458052186692676 0.25419478133073237 0.3943466152070144
0.7458052186692676 0.25419478133073237 0.4890847914913836
0.7458052186692676 0.25419478133073237 0.6801115299007139
0.7458052186692676 0.25419478133073237 0.4179414604440028
0.7458052186692676 0.25419478133073237 0.4457428395878422
0.7458052186692676 0.25419478133073237 0.8588312991588007
0.7458052186692676 0.25419478133073237 0.7321326719088616
0.7458052186692676 0.25419478133073237 0.12614317122529395
0.7458052186692676 0.25419478133073237 0.5774116675349952
0.7458052186692676 0.25419478133073237 0.6300979975567622
0.7458052186692676 0.25419478133073237 0.36590109077119326
0.7458052186692676 0.25419478133073237 0.9671806655279361
0.7458052186

In [170]:
h

{'France': 83, 'Qatar': 17}

In [171]:
h["France"]/nb

0.83