In [1]:
import numpy as np
from games.blotto import Blotto
from agents.regretmatching import RegretMatching
from agents.fictitiousplay import FictitiousPlay
from agents.random_agent import RandomAgent

##### Las reglas del "Blotto" son: 
-  Fijar un número entero (S)
-  Fijar otro número entero (N)

La idea es que cada jugador deberá elegir una secuencia de N números enteros positivos y no decrecientes, tales que la suma de esos números sea S.

Luego, se comparan los N valores de cada uno, componente a componente, y gana el jugador que tenga mas componentes de valor mas alto que su adversario. 

En su forma tradicional, el "Coronel Blotto" dispone de S soldados para combatir en N campos de batalla. En cada campo de batalla, ganará el que haya puesto más soldados, y la guerra (partida) será ganada por el que haya vencido en más de esas batallas simultáneas.

In [2]:
g = Blotto(S=6, N=3)

In [3]:
g.reset()

({'agent_0': None, 'agent_1': None}, None)

In [4]:
g._moves

[[1, 1, 4], [1, 2, 3], [2, 2, 2]]

#### Blotto, agente y oponente Regret

In [5]:
rm = dict(map(lambda agent: (agent, RegretMatching(game=g, agent=agent)), g.agents))

In [6]:
for i in range(10000):
    actions = dict(map(lambda agent: (agent, rm[agent].action()), g.agents))
    g.step(actions)

In [7]:
dict(map(lambda agent: (agent, g._moves[np.argmax(rm[agent].policy())]), g.agents))

{'agent_0': [1, 1, 4], 'agent_1': [1, 1, 4]}

#### Blotto, agente Regret y oponente Random

In [8]:
agent_classes = [ RegretMatching, RandomAgent ]
my_agents = {}
g.reset()
for i, agent in enumerate(g.agents):
    my_agents[agent] = agent_classes[i](game=g, agent=agent)


In [9]:
for i in range(10000):
    actions = dict(map(lambda agent: (agent, my_agents[agent].action()), g.agents))
    g.step(actions)

In [10]:
dict(map(lambda agent: (agent, g._moves[np.argmax(my_agents[agent].policy())]), g.agents))

{'agent_0': [1, 1, 4], 'agent_1': [1, 1, 4]}

#### Blotto, agente y oponente Fictitious

In [11]:
g.reset()

({'agent_0': None, 'agent_1': None}, None)

In [12]:
fp = dict(map(lambda agent: (agent, FictitiousPlay(game=g, agent=agent)), g.agents))

In [13]:
for i in range(10000):
    actions = dict(map(lambda agent: (agent, fp[agent].action()), g.agents))
    g.step(actions)

In [14]:
dict(map(lambda agent: (agent, g._moves[np.argmax(fp[agent].policy())]), g.agents))

{'agent_0': [2, 2, 2], 'agent_1': [2, 2, 2]}

#### Blotto, agente Fictitious y oponente Random

In [15]:
agent_classes = [ FictitiousPlay, RandomAgent ]
my_agents = {}
g.reset()
for i, agent in enumerate(g.agents):
    my_agents[agent] = agent_classes[i](game=g, agent=agent)


In [16]:
for i in range(10000):
    actions = dict(map(lambda agent: (agent, my_agents[agent].action()), g.agents))
    g.step(actions)

In [17]:
dict(map(lambda agent: (agent, g._moves[np.argmax(my_agents[agent].policy())]), g.agents))

{'agent_0': [2, 2, 2], 'agent_1': [1, 1, 4]}