In [52]:
from random import randint
from typing import Any, Self
from dataclasses import asdict, dataclass

In [2]:
import pandas as pd
import holoviews as hv
hv.extension('bokeh')

%opts magic unavailable (pyparsing cannot be imported)
%compositor magic unavailable (pyparsing cannot be imported)


In [114]:
class Acao:
    def __init__(self, val: str) -> None:
        self.val = val

    def __bool__(self) -> bool:
        return self.val == 'C'

    def __repr__(self) -> str:
        return self.val

    def reverter(self) -> Self:
        return self.__class__('T') if self.val == 'C' else self.__class__('C')

    def __eq__(self, other: Any) -> bool:
        return isinstance(other, self.__class__) and self.val == other.val


T = Acao('T')
C = Acao('C')

In [115]:
def houver(nivel: int) -> int:
    return nivel > randint(0, 99)

In [116]:
def payoff(p1, p2) -> tuple[int, int]:
    match bool(p1), bool(p2):
        case True, True:
            return 3, 3
        case True, False:
            return 0, 5
        case False, True:
            return 5, 0
        case False, False:
            return 1, 1

In [117]:
@dataclass
class Turno:
    a1: Acao
    a2: Acao
    r1: int
    r2: int

    @classmethod
    def from_acao(cls, a1: Acao, a2: Acao) -> Self:
        r1, r2 = payoff(a1, a2)
        o = cls(a1=a1, a2=a2, r1=r1, r2=r2)
        return o

    def __repr__(self) -> str:
        a1, a2 = self.a1, self.a2
        r1, r2 = self.r1, self.r2
        m = f'{a1}  {a2}  |  {r1: 2}  {r2: 2}'
        return m

    def reverter(self) -> Self:
        return self.__class__(a1=self.a2, a2=self.a1, r1=self.r2, r2=self.r1)

In [118]:
def aplicar_ruido(ruido: int, acao: Acao) -> Acao:
    return acao.reverter() if houver(ruido) else acao

In [119]:
@dataclass
class Estrategia:
    malandragem: int = 0
    justica: int = 0
    castigo: int = 0
    perdao: int = 0
    pontos: int = 0

    def __post_init__(self) -> None:
        self._castigo = 0

    def __repr__(self) -> str:
        s = ', '.join(
            (f'{k}={v:3}' if k != 'pontos' else f'{k}={v:6}')
            for k, v
            in asdict(self).items()
        )
        return f'Estrategia({s})'

    def __str__(self) -> str:
        return self.__repr__()

    def __mul__(self, val: int) -> list[Self]:
        return [self.__class__(**asdict(self)) for _ in range(val)]

    def jogar(self, passado: list[Turno], rev: bool, ruido: int) -> Acao:
        outra_acao = lambda p: p.a1 if rev is True else p.a2

        # justica
        if len(passado) > 0 and houver(self.justica):
            ultima_acao_real = outra_acao(passado[-1])
            ultima_acao_percebida = aplicar_ruido(ruido, ultima_acao_real)
            if bool(ultima_acao_percebida) is False:
                self._castigo = self.castigo + 1

        # perdao
        if houver(self.perdao):
            self._castigo = 0

        # castigar
        if self._castigo:
            self._castigo -= 1
            return T

        # malandragem
        return T if houver(self.malandragem) else C

In [120]:
def jogo(
    e1: Estrategia,
    e2: Estrategia,
    rodadas: int,
    ruido: int,
) -> tuple[Estrategia, Estrategia, str, list[Turno]]:

    turnos = []
    for n in range(rodadas):
        a1 = e1.jogar(turnos[-5:], rev=False, ruido=ruido)
        a2 = e2.jogar(turnos[-5:], rev=True, ruido=ruido)
        turno = Turno.from_acao(a1, a2)
        turnos.append(turno)
        e1.pontos += turno.r1
        e2.pontos += turno.r2

    if e1.pontos == e2.pontos:
        vencedor = 'empate'
    elif e1.pontos > e2.pontos:
        vencedor = 'e1'
    else:
        vencedor = 'e2'

    return e1, e2, vencedor, turnos

In [121]:
def arena(
    rodadas: int,
    estrategias: list[Estrategia],
    ruido: int = 0,
) -> list[Estrategia]:
    for pos1 in range(len(estrategias) - 1):
        for pos2 in range(pos1 + 1, len(estrategias)):
            e1 = estrategias[pos1]
            e2 = estrategias[pos2]
            e1, e2, vencedor, _ = jogo(e1=e1, e2=e2, rodadas=rodadas, ruido=ruido)
            estrategias[pos1] = e1
            estrategias[pos2] = e2
    estrategias = sorted(estrategias, key=lambda e: e.pontos, reverse=True)
    return estrategias

# Jogo 1: Cooperadora vs Trapaceira

In [148]:
Cooperadora = Estrategia(malandragem=0)
Trapaceira = Estrategia(malandragem=50)

In [149]:
e1, e2, _, t = jogo(Cooperadora, Trapaceira, rodadas=200, ruido=0)
df = pd.DataFrame(t)
df.head(10)

Unnamed: 0,a1,a2,r1,r2
0,C,T,0,5
1,C,T,0,5
2,C,T,0,5
3,C,T,0,5
4,C,T,0,5
5,C,T,0,5
6,C,C,3,3
7,C,T,0,5
8,C,C,3,3
9,C,C,3,3


In [150]:
def colorir(df):
    def destacar_acao(v):
        if v == C:
            return 'background-color: green'
        elif v == T:
            return 'background-color: red'
    return df.style.apply(lambda x: x.map(destacar_acao), axis=None)

colorir(df.head(10))

Unnamed: 0,a1,a2,r1,r2
0,C,T,0,5
1,C,T,0,5
2,C,T,0,5
3,C,T,0,5
4,C,T,0,5
5,C,T,0,5
6,C,C,3,3
7,C,T,0,5
8,C,C,3,3
9,C,C,3,3


In [151]:
df['r1_acc'] = df['r1'].cumsum()
df['r2_acc'] = df['r2'].cumsum()
colorir(df.head(10))

Unnamed: 0,a1,a2,r1,r2,r1_acc,r2_acc
0,C,T,0,5,0,5
1,C,T,0,5,0,10
2,C,T,0,5,0,15
3,C,T,0,5,0,20
4,C,T,0,5,0,25
5,C,T,0,5,0,30
6,C,C,3,3,3,33
7,C,T,0,5,3,38
8,C,C,3,3,6,41
9,C,C,3,3,9,44


In [152]:
opts = dict(width=500, height=400, show_grid=True)
hv.Curve(df, kdims='index', vdims='r1_acc') * hv.Curve(df, kdims='index', vdims='r2_acc').opts(**opts)

# Jogo 2: O mundo com v√°rias pessoas

In [153]:
e = (
    Cooperadora * 5
    + Trapaceira * 5
)

for i in arena(rodadas=200, estrategias=e): print(i);

Estrategia(malandragem= 50, justica=  0, castigo=  0, perdao=  0, pontos=  6722)
Estrategia(malandragem= 50, justica=  0, castigo=  0, perdao=  0, pontos=  6703)
Estrategia(malandragem= 50, justica=  0, castigo=  0, perdao=  0, pontos=  6575)
Estrategia(malandragem= 50, justica=  0, castigo=  0, perdao=  0, pontos=  6574)
Estrategia(malandragem= 50, justica=  0, castigo=  0, perdao=  0, pontos=  6463)
Estrategia(malandragem=  0, justica=  0, castigo=  0, perdao=  0, pontos=  4257)
Estrategia(malandragem=  0, justica=  0, castigo=  0, perdao=  0, pontos=  4245)
Estrategia(malandragem=  0, justica=  0, castigo=  0, perdao=  0, pontos=  4239)
Estrategia(malandragem=  0, justica=  0, castigo=  0, perdao=  0, pontos=  4194)
Estrategia(malandragem=  0, justica=  0, castigo=  0, perdao=  0, pontos=  4164)


# Jogo 3: A defesa contra a malandragem

In [154]:
Justiceira = Estrategia(malandragem=0, justica=100)
Trapaceira = Estrategia(malandragem=50, justica=0)

e = (
    Justiceira * 12
    + Trapaceira * 12
)

for i in arena(rodadas=200, estrategias=e): print(i);

Estrategia(malandragem=  0, justica=100, castigo=  0, perdao=  0, pontos= 12067)
Estrategia(malandragem=  0, justica=100, castigo=  0, perdao=  0, pontos= 12058)
Estrategia(malandragem=  0, justica=100, castigo=  0, perdao=  0, pontos= 12040)
Estrategia(malandragem=  0, justica=100, castigo=  0, perdao=  0, pontos= 12022)
Estrategia(malandragem=  0, justica=100, castigo=  0, perdao=  0, pontos= 11999)
Estrategia(malandragem=  0, justica=100, castigo=  0, perdao=  0, pontos= 11990)
Estrategia(malandragem=  0, justica=100, castigo=  0, perdao=  0, pontos= 11970)
Estrategia(malandragem=  0, justica=100, castigo=  0, perdao=  0, pontos= 11970)
Estrategia(malandragem=  0, justica=100, castigo=  0, perdao=  0, pontos= 11960)
Estrategia(malandragem=  0, justica=100, castigo=  0, perdao=  0, pontos= 11956)
Estrategia(malandragem=  0, justica=100, castigo=  0, perdao=  0, pontos= 11951)
Estrategia(malandragem=  0, justica=100, castigo=  0, perdao=  0, pontos= 11934)
Estrategia(malandragem= 50, 

In [156]:
e1, e2, _, t = jogo(Justiceira, Trapaceira, rodadas=200, ruido=0)
df = pd.DataFrame(t)
colorir(df.head(10))

Unnamed: 0,a1,a2,r1,r2
0,C,C,3,3
1,C,C,3,3
2,C,T,0,5
3,T,C,5,0
4,C,C,3,3
5,C,T,0,5
6,T,T,1,1
7,T,C,5,0
8,C,T,0,5
9,T,C,5,0


In [157]:
Justiceira = Estrategia(malandragem=0, justica=100)
JusticeiraPassaPano = Estrategia(malandragem=0, justica=50)
Trapaceira = Estrategia(malandragem=50, justica=0)

e = (
    Justiceira * 8
    + JusticeiraPassaPano * 8
    + Trapaceira * 8
)

for i in arena(rodadas=200, estrategias=e): print(i);

Estrategia(malandragem=  0, justica=100, castigo=  0, perdao=  0, pontos= 12653)
Estrategia(malandragem=  0, justica=100, castigo=  0, perdao=  0, pontos= 12629)
Estrategia(malandragem=  0, justica=100, castigo=  0, perdao=  0, pontos= 12625)
Estrategia(malandragem=  0, justica=100, castigo=  0, perdao=  0, pontos= 12606)
Estrategia(malandragem=  0, justica=100, castigo=  0, perdao=  0, pontos= 12586)
Estrategia(malandragem=  0, justica=100, castigo=  0, perdao=  0, pontos= 12540)
Estrategia(malandragem=  0, justica=100, castigo=  0, perdao=  0, pontos= 12535)
Estrategia(malandragem=  0, justica=100, castigo=  0, perdao=  0, pontos= 12521)
Estrategia(malandragem=  0, justica= 50, castigo=  0, perdao=  0, pontos= 12082)
Estrategia(malandragem=  0, justica= 50, castigo=  0, perdao=  0, pontos= 12070)
Estrategia(malandragem=  0, justica= 50, castigo=  0, perdao=  0, pontos= 12059)
Estrategia(malandragem=  0, justica= 50, castigo=  0, perdao=  0, pontos= 12029)
Estrategia(malandragem=  0, 

In [466]:
Justiceira = Estrategia(malandragem=0, justica=100)
JusticeiraPassaPano = Estrategia(malandragem=0, justica=50)
Trapaceira = Estrategia(malandragem=50, justica=0)
CidadaDeBem = Estrategia(malandragem=50, justica=50)

e = (
    Justiceira * 6
    + JusticeiraPassaPano * 6
    + Trapaceira * 6
    + CidadaDeBem * 6
)

for i in arena(rodadas=200, estrategias=e): print(i);

Estrategia(malandragem=  0, justica=100, castigo=  0, perdao=  0, pontos= 11648)
Estrategia(malandragem=  0, justica=100, castigo=  0, perdao=  0, pontos= 11614)
Estrategia(malandragem=  0, justica=100, castigo=  0, perdao=  0, pontos= 11581)
Estrategia(malandragem=  0, justica=100, castigo=  0, perdao=  0, pontos= 11563)
Estrategia(malandragem=  0, justica=100, castigo=  0, perdao=  0, pontos= 11548)
Estrategia(malandragem=  0, justica=100, castigo=  0, perdao=  0, pontos= 11511)
Estrategia(malandragem= 50, justica=  0, castigo=  0, perdao=  0, pontos= 11101)
Estrategia(malandragem= 50, justica=  0, castigo=  0, perdao=  0, pontos= 11036)
Estrategia(malandragem= 50, justica=  0, castigo=  0, perdao=  0, pontos= 10975)
Estrategia(malandragem= 50, justica=  0, castigo=  0, perdao=  0, pontos= 10935)
Estrategia(malandragem=  0, justica= 50, castigo=  0, perdao=  0, pontos= 10933)
Estrategia(malandragem= 50, justica=  0, castigo=  0, perdao=  0, pontos= 10922)
Estrategia(malandragem=  0, 

In [468]:
e = [
    Estrategia(malandragem=m, justica=j)
    for m in range(0, 70, 10)
    for j in range(0, 100, 10)
]

resultado = arena(rodadas=200, estrategias=e)
for i in resultado: print(i);

Estrategia(malandragem= 60, justica= 80, castigo=  0, perdao=  0, pontos= 34419)
Estrategia(malandragem= 60, justica= 90, castigo=  0, perdao=  0, pontos= 34169)
Estrategia(malandragem= 60, justica= 20, castigo=  0, perdao=  0, pontos= 34092)
Estrategia(malandragem= 60, justica= 60, castigo=  0, perdao=  0, pontos= 34080)
Estrategia(malandragem= 60, justica= 70, castigo=  0, perdao=  0, pontos= 34080)
Estrategia(malandragem= 50, justica= 80, castigo=  0, perdao=  0, pontos= 34060)
Estrategia(malandragem= 60, justica= 30, castigo=  0, perdao=  0, pontos= 34060)
Estrategia(malandragem= 50, justica= 90, castigo=  0, perdao=  0, pontos= 33998)
Estrategia(malandragem= 60, justica= 40, castigo=  0, perdao=  0, pontos= 33995)
Estrategia(malandragem= 60, justica= 50, castigo=  0, perdao=  0, pontos= 33952)
Estrategia(malandragem= 50, justica= 70, castigo=  0, perdao=  0, pontos= 33685)
Estrategia(malandragem= 60, justica=  0, castigo=  0, perdao=  0, pontos= 33676)
Estrategia(malandragem= 50, 

In [158]:
df = pd.DataFrame([asdict(r) for r in resultado])
df.head()

Unnamed: 0,malandragem,justica,castigo,perdao,pontos
0,50,0,0,0,7491
1,50,0,0,0,7475
2,50,0,0,0,7446
3,50,0,0,0,7436
4,50,0,0,0,7320


In [489]:
opts = dict(width=500, height=400, colorbar=True, cmap='coolwarm')
hv.HeatMap(df, kdims=['malandragem', 'justica'], vdims=['pontos']).opts(**opts)

In [181]:
Justiceira = Estrategia(malandragem=0, justica=100)
Trapaceira = Estrategia(malandragem=50, justica=0)
CidadaDeBem = Estrategia(malandragem=50, justica=50)

e = [
    Estrategia(malandragem=m, justica=j)
    for m in range(0, 101, 20)
    for j in range(0, 101, 20)
] + Justiceira * 30

resultado = arena(rodadas=200, estrategias=e)
for i in resultado: print(i);

Estrategia(malandragem=  0, justica=100, castigo=  0, perdao=  0, pontos= 30897)
Estrategia(malandragem=  0, justica=100, castigo=  0, perdao=  0, pontos= 30872)
Estrategia(malandragem=  0, justica=100, castigo=  0, perdao=  0, pontos= 30872)
Estrategia(malandragem=  0, justica=100, castigo=  0, perdao=  0, pontos= 30849)
Estrategia(malandragem=  0, justica=100, castigo=  0, perdao=  0, pontos= 30840)
Estrategia(malandragem=  0, justica=100, castigo=  0, perdao=  0, pontos= 30810)
Estrategia(malandragem=  0, justica=100, castigo=  0, perdao=  0, pontos= 30805)
Estrategia(malandragem=  0, justica=100, castigo=  0, perdao=  0, pontos= 30800)
Estrategia(malandragem=  0, justica=100, castigo=  0, perdao=  0, pontos= 30800)
Estrategia(malandragem=  0, justica=100, castigo=  0, perdao=  0, pontos= 30797)
Estrategia(malandragem=  0, justica=100, castigo=  0, perdao=  0, pontos= 30794)
Estrategia(malandragem=  0, justica=100, castigo=  0, perdao=  0, pontos= 30785)
Estrategia(malandragem=  0, 

In [185]:
df = pd.DataFrame([asdict(r) for r in resultado])
df2 = df.groupby(['malandragem', 'justica'])['pontos'].mean().reset_index()

In [186]:
opts = dict(width=500, height=400, colorbar=True, cmap='coolwarm')
hv.HeatMap(df2, kdims=['malandragem', 'justica'], vdims=['pontos']).opts(**opts)