<div align="right" style="text-align:right"><a rel="license" href="http://creativecommons.org/licenses/by-nc-nd/4.0/"><img alt="Licença Creative Commons" style="border-width:0; float:right" src="https://i.creativecommons.org/l/by-nc-nd/4.0/88x31.png" /></a><br><br><i>Prof. Marcelo de Souza</i><br>marcelo.desouza@udesc.br</div>

# Jogo do Descarte

Trata-se de um jogo de cartas onde um agente único joga contra a mesa (ambiente).


## Regras

+ Joga-se com um baralho normal (cartas de A a K de quatro naipes; excluídos os coringas);
+ O jogo inicia com uma carta na mesa voltada para cima (chamada carta aberta), cinco cartas na mão do (único) jogador, e as demais cartas em um monte de compra (virado para baixo);
+ O jogador pode descartar uma carta da sua mão, desde que ela seja do mesmo número ou do mesmo naipe da carta aberta. Neste caso, a carta descartada substitui a carta aberta e o jogo prossegue;
+ O jogador pode descartar tantas cartas seguidas quanto for possível; quando o jogador não consegue descartar nenhuma das cartas da sua mão, ele compra uma carta e tenta fazer o descarte;
+ O jogo termina quando o jogador descartar todas as cartas de sua mão; a quantidade de cartas que sobraram no monte de compra é a pontuação do jogador;
+ Caso o monte de compras termine sem o descarte total da mão do jogador, a mesa vence e as cartas restantes na mão contam como pontuação negativa.


## Implementação

O ambiente está implementado na classe ``Environment``. Essa classe não deve ser modificada.

In [54]:
import random
VERBOSE = False

class Environment:
    __shown_card = None
    __stack = None
    __hand = None
    
    def __init__(self, seed = None):
        self.__setup(seed)
    
    def __setup(self, seed = None):
        if seed is not None: random.seed(seed)
            
        numbers = ['1', '2', '3', '4', '5', '6', '7', '8', '9', '10', 'J', 'Q', 'K']
        suits = ['P', 'C', 'E', 'O']
        all_cards = []
        for number in numbers:
            for suit in suits:
                all_cards.append(number + '_' + suit)

        random.shuffle(all_cards)
        self.__hand = all_cards[:5]
        self.__shown_card = all_cards[5]
        self.__stack = all_cards[6:]

    def finish(self):
        return len(self.__hand) == 0 or len(self.__stack) == 0
    
    def score(self):
        return len(self.__stack) - len(self.__hand)
        
    def sense(self):
        return self.__shown_card, self.__hand

    def act(self, action):
        if VERBOSE:
            print('Shown card is %s' % self.__shown_card)
            print('Hand is', self.__hand)
        if action is not None:
            if VERBOSE: print('Disposing card %s\n---' % action)
            self.__hand.remove(action)
            self.__shown_card = action
        else:
            if VERBOSE: print('Getting card %s from stack\n---' % self.__stack[-1])
            self.__hand.append(self.__stack.pop())

Implementamos um agente simples ``DummyAgent`` que descarta a primeira carta possível de descartar que encontra em sua mão.

In [55]:
class DummyAgent:
    def __init__(self, _env):
        self.env = _env
    
    def step(self):
        shown_card, hand = self.__sense()
        action = self.__act(shown_card, hand)
        self.env.act(action)
        
    def __sense(self):
        shown_card, hand = env.sense()
        return shown_card, hand
    
    def __act(self, shown_card, hand):
        for card in hand:
            if self.__disposable(shown_card, card):
                return card
        return None

    def __disposable(self, shown_card, card):
        number = shown_card.split('_')[0]
        suit = shown_card.split('_')[1]
        c_number = card.split('_')[0]
        c_suit = card.split('_')[1]
        return (c_number == number or c_suit == suit)

Finalmente, implementamos uma rotina de jogo. A semente permite controlar a ordem das cartas no baralho e replicar o mesmo jogo para diferentes agentes. De momento, definimos a semente como ``None`` para gerar jogos (pseudo-) aleatórios.

In [65]:
#VERBOSE = True
seed = None
env = Environment(seed)
agent = DummyAgent(env)

while not env.finish():
    agent.step()
print(env.score())


7


Podemos executar o agente dummy repetidas vezes e computar seu desempenho médio, para então comparar com outros agentes (para isso, o ideal é usar o mesmo conjunto de sementes nas execuções de ambos agentes e, então, usar um teste estatístico paramétrico para amostras pareadas).

In [66]:
import statistics

results = []
for _ in range(1000):
    seed = None
    env = Environment(seed)
    agent = DummyAgent(env)

    while not env.finish():
        agent.step()
    results.append(env.score())

print('RESULTS')
print('Number of samples: %d' % len(results))
print('Wins: %d (%.1f%%)' % (sum([1 for x in results if x >= 0]), sum([1 for x in results if x >= 0]) * 100 / len(results)))
print('Losses: %d (%.1f%%)' % (sum([1 for x in results if x < 0]), sum([1 for x in results if x < 0]) * 100 / len(results)))
print('Mean score: %.1f' % statistics.mean(results))
print('Standard deviation (score): %.1f' % statistics.stdev(results))
print('Median score: %.1f' % statistics.median(results))

RESULTS
Number of samples: 1000
Wins: 710 (71.0%)
Losses: 290 (29.0%)
Mean score: 17.0
Standard deviation (score): 18.7
Median score: 20.0
