<h1>Cadeias de Markov com Python</h1>

Cadeias de Markov são modelos que descrevem uma sequência de eventos dos quais a probabilidade da ocorrência de cada evento, depende apenas da ocorrência anterior e não de toda sequência. Vejamos um exemplo:

<h3>Pepsi vs Coca</h3>

Suponha que determinada pessoa, ou um grupo de pessoas, só bebe Coca ou só bebe Pepsi, além de seguir as seguintes regras:

- Ele bebe apenas uma lata por semana.
- Se ele bebeu Pepsi em uma determinada semana, na próxima ele vai beber Pepsi com probabilidade de 70% ou vai beber Coca com probabilidade de 30%. Essas probabilidades são fixas na sequência de eventos.
- Se ele bebeu Coca em uma determinada semana, na próxima ele vai beber Pepsi com probabilidade de 10% ou vai beber Coca com probabilidade de 90%. Essas probabilidades são fixas na sequência de eventos.

Os números nesse exemplo são fictícios. Além disso, as probabilidades no mundo real são alteradas por campanhas de marketing e outros eventos. O exemplo acima é simplesmente para entender como as cadeias de markov funcionam. Considere a seguinte pergunta:

<i>Supondo que, nessa semana, 40%  de um grupo de pessoas tenham bebido Pepsi e 60% tenham bebido Coca. Qual a porcentagem provável de pessoas, desse mesmo grupo, beberão Coca na semana seguinte?</i>

<img src="pepsiCocaProbs.png" width=400px>

Em forma matricial, podemos representar esse processo do seguinte modo:

<img src="modelagem.png" width="500px">

Denotando por Pi e Ci as porcentagens de pessoas que beberam Pepsi e Coca na semana i respectivamente, temos as seguintes propriedades:

$$\begin{array}[rcl]\\
p\left(P_{i+1} | P_i \right) & = & 0.7\\
p\left(C_{i+1} | P_i \right) & = & 0.3\\
p\left(P_{i+1} | C_i \right) & = & 0.1\\
p\left(C_{i+1} | C_i \right) & = & 0.9\\
\end{array}$$

Usando o Teorema de Bayes temos:

$$\begin{array}[ccc]\\
p(P_{i+1}) & = & p(P_{i+1}|P_{i})p(P_{i}) + p(P_{i+1}|C_{i})p(C_{i})
\end{array}$$

$$\begin{array}[ccc]\\
p(C_{i+1}) & = & p(C_{i+1}|P_{i})p(P_{i}) + p(C_{i+1}|C_{i})p(C_{i}) \\
\end{array}$$

Para o nosso exemplo, supondo que essa semana seja a semana 1 e a semana seguinte seja a semana 2:

$$\begin{array}[ccc]\\
p(P_2) & = & p(P_2|P_1)p(P_1) + p(P_2|C_1)p(C_1) \\
& = & 0.7 * 0.4 + 0.1 * 0.6 \\
& = & 0.34
\end{array}$$

$$\begin{array}[ccc]\\
p(C_2) & = & p(C_2|P_1)p(P_1) + p(C_2|C_1)p(C_1) \\
& = & 0.3 * 0.4 + 0.9 * 0.6 \\
& = & 0.66
\end{array}$$

Logo, é provável que 66% das pessoas no grupo tomem Coca na semana seguinte.

Agora, observe a segunda igualdade de cada uma das expressões acima. Elas são obtidas da multiplicação da matriz de probabilidade pelo vetor de porcentagens do grupo na semana atual:

<img src="produto.png" width="500px">

Isso quer dizer que, para encontrar as porcentagens após duas semanas, basta multiplicar a matriz de probabilidades duas vezes!

<img src="produto2.png" width="500px">

Para conferir as contas acima, usaremos Python e a biblioteca numpy:

In [1]:
# importando numpy
import numpy as np

# definindo a matriz
# probabilidades semana 1
M1 = np.array([
    [0.7, 0.1],
    [0.3, 0.9]
])

# calculando a matriz
# probabilidades semana 2
M2 = np.linalg.matrix_power(M1, 2)

# definindo grupo
# semana 1
grupo_semana1 = np.array([
    [0.4],
    [0.6]
])

# calculando grupo
# semana 3
grupo_semana3 = np.matmul(M2, grupo_semana1)
print(grupo_semana3)

[[0.304]
 [0.696]]


De forma geral, para descobrirmos como estará a preferência dos usuários na 11ª semana, podemos fazer o seguinte cálculo:

$$\left(\begin{array}[cc]\\ 0.7 & 0.1 \\ 0.3 & 0.9 \\ \end{array}\right)^{10}\left(\begin{array}[c] \\
0.4 \\
0.6 \\
\end{array}\right) = \left(
\begin{array}[c]\\ ? \\ ? \\ \end{array}\right)$$

O código nesse caso fica:

In [2]:
# importando numpy
import numpy as np

# definindo a matriz
# probabilidades semana 1
M1 = np.array([
    [0.7, 0.1],
    [0.3, 0.9]
])

# calculando a matriz
# probabilidades semana 10
M10 = np.linalg.matrix_power(M1, 10)

# definindo grupo
# semana 1
grupo_semana1 = np.array([
    [0.4],
    [0.6]
])

# calculando grupo
# semana 10
grupo_semana11 = np.matmul(M10, grupo_semana1)
print(grupo_semana11)

[[0.25090699]
 [0.74909301]]


E temos nossa resposta:

$$\left(\begin{array}[cc]\\ 0.7 & 0.1 \\ 0.3 & 0.9 \\ \end{array}\right)^{10}\left(\begin{array}[c] \\
0.4 \\
0.6 \\
\end{array}\right) = \left(
\begin{array}[c]\\ 0.25 \\ 0.75 \\ \end{array}\right)$$

<h3>Snake and Ladders</h3>

Snakes and Ladders (cobras e escadas no português) é um jogo em que o jogador tem que avançar por casas de um tabuleiro seguindo a ordem numérica das casas e as regras para movimento.

<img src="snakeLadder2.png" width="500px">

Alan Golder é um ladrão de jóias e pretende roubar o baú de ouro que está na casa 9. Ele inicia sua empreitada na casa 1 e segue as seguintes regras:

- Movimenta-se apenas uma vez por rodada de acordo com os números obtidos na rolagem de dado.
- Na rolagem de dados, joga um único dado e, se o número for par, ele avança duas casas. Se for ímpar, ele avança apenas uma casa.
- Golder sempre avança a quantidade determinada pelos dados de acordo com a regra anterior e sempre na ordem numérica crescente, exceto quando seu movimento acaba nas casa 3 ou 8.
- Se o movimento acaba na casa 3, ele sobe a escada e, na mesma rodada, ocupa a casa 5.
- Se o movimento acaba na casa 8, ele é mordido pela cobra e, na mesma rodada, cai para a casa 4.

Alan Golder precisa saber qual a probabilidade de roubar o tesouro em até 21 rodadas, pois ele precisa ser rápido. Ele nos capturou e disse que só podemos sair vivos se fizermos essa conta para ele. É uma questão de vida ou morte, não temos escolha. Ainda bem que sabemos cadeia de Markov!

Vejamos a representação em forma de tabela:

<img src="tabelaAlan.png" width="600px">

Utilizando Python temos:

$$\left(\begin{array}[ccccccc]\\ 0 & 0 & 0 & 0 & 0 & 0 & 0 \\ 0.5 & 0 & 0 & 0 & 0 & 0 & 0 \\ 0 & 0.5 & 0 & 0 & 0 & 0 & 0 \\ 0.5 & 0.5 & 0.5 & 0 & 0 & 0 & 0 \\ 0 & 0 & 0.5 & 0.5 & 0.5 & 0.5 & 0 \\ 0 & 0 & 0 & 0.5 & 0.5 & 0 & 0 \\ 0 & 0 & 0 & 0 & 0 & 0.5 & 1 \\ \end{array}\right)^{20}\left(\begin{array}[c] \\
1 \\
0 \\
0 \\
0 \\
0 \\
0 \\
0 \\
\end{array}\right) = \left(
\begin{array}[c]\\ ? \\ ? \\ ? \\ ? \\ ? \\ ? \\ ? \\\end{array}\right)$$

In [3]:
# importando numpy
import numpy as np

M1 = np.array([
    [   0,   0,   0,   0,   0,   0,   0],
    [ 0.5,   0,   0,   0,   0,   0,   0],
    [   0, 0.5,   0,   0,   0,   0,   0],
    [ 0.5, 0.5, 0.5,   0,   0,   0,   0],
    [   0,   0, 0.5, 0.5, 0.5, 0.5,   0],
    [   0,   0,   0, 0.5, 0.5,   0,   0],
    [   0,   0,   0,   0,   0, 0.5,   1],
])

M_rodada20 = np.linalg.matrix_power(M1, 20)

alan_rodada1 = np.array([[1],[0],[0],[0],[0],[0],[0]])

alan_rodada20 = np.matmul(M_rodada20, alan_rodada1)
print(alan_rodada20)

[[0.        ]
 [0.        ]
 [0.        ]
 [0.        ]
 [0.01536751]
 [0.00949764]
 [0.97513485]]


Estamos salvos! Alan tem 1,5% de chances de estar na casa 6, na casa 8 ele tem 0.9% de chances e de conseguir roubar o tesouro antes da rodada 20, ele tem 97,51% de chances.

<h3>Sumário</h3>

Vimos como cadeias de Markov podem ser utilizadas para modelar sequência de eventos com probabilidade fixas. Também passamos por dois famosos exemplos, Pepsi vs Coca e Snake and Ladders.

Agora é sua vez! E se Alan Golder precisasse ser mais rápido! Faça os cálculo para no máximo 10 rodadas!

<h3>O jogo do céu e do inferno</h3>

<img src="ceuinferno.jpg" width="400px">

<i>"Este velho jogo indiano, conhecido popularmente como 'Snakes and Ladders', foi originalmente um instrumento para o ensino de ética. Cada casa apresenta, além de um número, uma lenda contendo virtudes e vícios . A mais longa escada encontra-se na casa 17 'Compaixão e amor' e leva até a casa 69 'O mundo do absoluto'."</i>

Texto traduzido do site https://wellcomecollection.org/works/geydgvms

Espero que tenham gostado!

Até a próxima \o