In [5]:
import pandas as pd
import numpy as np

In [6]:
df = pd.read_csv('barcelapa.csv')
df.score = 4 - df.score
df.folego = 4 - df.folego

In [7]:
df.sort_values(['posicao'])

Unnamed: 0,nome,posicao,score,pe,folego
0,Edu,ataque,3,d,3
17,Murillo,ataque,2,d,1
13,Caio,ataque,1,e,2
12,Uirá,ataque,3,d,2
20,Rafael,ataque,0,d,0
18,Gui,ataque,0,d,1
19,Henrique,ataque,3,e,0
1,Thiago primo Rubino,ataque,3,d,3
4,Rodrigo 🥅,gol,1,d,3
3,Leonardo (goleiro),gol,2,d,3


In [52]:
from random import sample, seed
seed(42)

def seleciona_times(df):
    # Sorteia os times aleatoriamente
    # 1 goleiro, 1  zagueiro, 2 meias e 2 ataques
    df = df.sample(frac = 1)#, random_state = 42)
    
    times = []
    for i in range(4):
        t = [df[df.posicao == 'gol'].nome.to_list()[i]]
        t = t + [df[df.posicao == 'zaga'].nome.to_list()[i]]
        t = t + df[df.posicao == 'meio'].nome[(i*2):((i+1)*2)].to_list()
        t = t + df[df.posicao == 'ataque'].nome[(i*2):((i+1)*2)].to_list()
        

        times.append(t)
        
    return times

def score_time(df, time, metrica = 'score'):
    # Calcula o score total somando 'metrica' para todos os jogadores do time
    score = df.loc[df.nome.isin(time), metrica].sum()
        
    return score

def __lista_movimentos(df, t1, t2, metrica = 'score'):
    # São 10 possiveis trocas entre t1 e t2:
    # 1. Trocar goleiro
    # 2. Trocar zagueiro
    # 3. Trocar um atacante (4 possibilidades)
    # 4. Trocar um meia (4 possibilidades)
    #
    # Troca = (j1, j2, v) - j1 sai de t1 e j2  sai de t2, v é o score de j2 - score de j1
    #
    # Assumo que a lista t1 está organizada na ordem (gol, zag, mei, mei, ata, ata)
    movs = []
    
    # Goleiro
    j1 = t1[0]
    j2 = t2[0]
    s1 = df.loc[df.nome == j1, metrica].values[0]
    s2 = df.loc[df.nome == j2, metrica].values[0]
    movs.append((j1, j2, s2 - s1))
    
    # Zagueiro
    j1 = t1[1]
    j2 = t2[1]
    s1 = df.loc[df.nome == j1, metrica].values[0]
    s2 = df.loc[df.nome == j2, metrica].values[0]
    movs.append((j1, j2, s2 - s1))    
    
    # Meias
    for j1 in (t1[2], t1[3]):
        for j2 in (t2[2], t2[3]):
            s1 = df.loc[df.nome == j1, metrica].values[0]
            s2 = df.loc[df.nome == j2, metrica].values[0]
            movs.append((j1, j2, s2 - s1))    
            
            
    # Ataque
    for j1 in (t1[4], t1[5]):
        for j2 in (t2[4], t2[5]):
            s1 = df.loc[df.nome == j1, metrica].values[0]
            s2 = df.loc[df.nome == j2, metrica].values[0]
            movs.append((j1, j2, s2 - s1))                
    
    return movs

def cartolagem(df, t1, t2, tipo = 'greedy'):
    # Aplica a cartolagem para equilibrar t1 e t2
    
    # Score t1 e t2
    s1 = score_time(df, t1, 'score')
    s2 = score_time(df, t2, 'score')
    
    # t1 tem que ser o pior
    if s2 < s1:
        tmp = t2
        t2 = t1
        t1 = tmp
        tmp = s2
        s2 = s1
        s1 = tmp
    
    # Obtém a lista de movimentos
    mov = __lista_movimentos(df, t1, t2, 'score')
    mov_valido = [m for m in mov if m[2] >= 0 and m[2] < s2 - s1]
    
    if len(mov_valido) > 0:
        if tipo == 'greedy':
            # Executa o movimento com maior diferença
            ganho = [m[2] for m in mov_valido]
            ganho_max = max(ganho)
            ms = [m for m in mov_valido if m[2] == ganho_max]
            m = sample(ms, 1)
        else:
            # Aleatoriza o movimento
            m = sample(mov_valido, 1)

        m = m[0]

        t1[t1.index(m[0])] = m[1]
        t2[t2.index(m[1])] = m[0]
    else:
        m = None
        
    return m, t1, t2

In [56]:
# Loop principal
from joblib import Parallel, delayed

# Número de indivíduos na população
N = 100

def evolui():
    # Seleciona os times e vai fazendo cartolagem até equilibrar 
    maxiter = 10
    
    tm = seleciona_times(df)
    scores = [score_time(df, tm[j]) for j in range(4)]

    smin = min(scores)
    smax = max(scores)

    i1 = scores.index(smin)
    i2 = scores.index(smax)
    t1 = tm[i1]
    t2 = tm[i2]
    
    i = 0
    while i < maxiter:
        m, t1, t2 = cartolagem(df, t1, t2, tipo = 'rnd')

        if m is not None:
            tm[i1] = t1
            tm[i2] = t2

            scores = [score_time(df, tm[j]) for j in range(4)]

            smin = min(scores)
            smax = max(scores)
            i1 = scores.index(smin)
            i2 = scores.index(smax)
            t1 = tm[i1]
            t2 = tm[i2]
        else:
            break
        i = i + 1
    
    return (tm, smax - smin)

times = Parallel(n_jobs = -1)(delayed(evolui)() for i in range(N))

In [68]:
# Pegando os times mais equilibrados
difs = [t[1] for t in times]

mdif = min(difs)
times = [t for t in times if t[1] == mdif]
print("{} times encontrados".format(len(times)))

92 times encontrados


In [69]:
# Sorteia o time
seed(42)
sample(times, 1)

[([['Rodrigo 🥅', 'Paulo', 'Fravinho', 'Marcos Vinicius', 'Murillo', 'Edu'],
   ['Carbone', 'Daniel', 'Carlos', 'Diogo', 'Thiago primo Rubino', 'Gui'],
   ['Leonardo (goleiro)',
    'Arthur',
    'rubino',
    'Gabriel Biro',
    'Rafael',
    'Uirá'],
   ['Gabal', 'Luquinhas', 'Vinicius', 'Chile', 'Caio', 'Henrique']],
  1)]