### Принцип минимакса в решении игровых задач

#### Основные понятия

&#8195;&#8195; Во многих практических задачах возникают ситуации, когда требуется принять решение, не имея достаточной информации. Неизвестными могут быть как условия осуществления какой-либо операции, так и сознательные действия лиц, от которых зависит успех этой операции.

&#8195;&#8195; Матричной игрой называется игра, осуществляемая по следующим правилам:
- В игре участвуют два игрока;
- Каждый из игроков обладает конечным набором стратегий;
- Игра заключается в том, что каждый из игроков, не имея информации о действиях противника, делает один ход (выбирает одну из своих стратегий). Результатом выбора игроками стратегий является выигрыш и проигрыш в игре.
- И выигрыш, и проигрыш выражаются числами.

#### Матричная игра с нулевой суммой

&#8195;&#8195; Матричная игра называется игрой с нулевой суммой, если в этой игре выигрыш одного игрока равняется проигрышу другого игрока.
        
&#8195;&#8195; Каждая матричная игра с нулевой суммой имеет платежную матрицу. Для того чтобы построить эту матрицу, обозначим одного из игроков символом A, а другого - символом B, и предположим, что $A_1$, $A_2$, ..., $A_m$ - стратегии, которые может применять игрок A, а $B_1$, $B_2$, ..., $B_n$ - стратегии, которые может применять игрок B.

&#8195;&#8195; Матричная игра, в которой у игрока A имеется m стратегий, а у игрока B - n стратегий, называется игрой типа m$\times$n.

#### Нижняя и верхняя цена игры. Принцип минимакса

Рассмотрим матричную игру типа m$\times$n с платежной матрицей 
        \begin{array}{cccc}
            c_{11} & c_{12} & \ldots & c_{1n}\\
            c_{21} & c_{22} & \ldots & c_{2n}\\
            \vdots & \vdots & \ddots & \vdots\\
            c_{m1} & c_{m2} & \ldots & c_{mn}
        \end{array}
        
&#8195;&#8195; Если игрок A выберет стратегию $A_i$, то все его возможные выигрыши будут элементами i-й строки матрицы C. В наихудшем для игрока A случае, когда игрок B применяет стратегию, соответствующую минимальному элементу этой строки, выигрыш игрока A будет равен числу min $c_{ij}$, 1$\leq$j$\leq$n.
    
&#8195;&#8195; Следовательно, для получения наибольшего выигрыша, игроку A нужно выбирать ту из стратегий, для которой число min $c_{ij}$ (1$\leq$j$\leq$n) максимально. Это значение принятно считать нижней ценой игры.

&#8195;&#8195;  Следовательно, игроку B нужно выбрать такую стратегию, для которой число max $c_{ij}$ (1$\leq$i$\leq$m) минимально. Это значение принято называть верхней ценой игры.

#### Игры с седловой точкой

Игра называется игрой с седловой точкой, если ее нижняя и верхняя цены совпадают, то есть выполняется равенство
    
&#8195;&#8195; $\alpha$=max min $c_{ij}$=min max $c_{ij}$=$\beta$, 1$\leq$i$\leq$m, 1$\leq$j$\leq$n
    
Для игры с седловой точкой общее значение нижней и верхней цены игры
    
&#8195;&#8195; V=$\alpha$=$\beta$

называется ценой игры. Если седловая точка существует, то игра заканчивается после нахождения цены игры.

&#8195;&#8195; Если селовая точка отсутствует, то в чистых стратегиях рассматриваемая игра не разрешима. Значит, результат этой игры определится в смешанных стратегиях.

#### Теперь перейдем к практическому решению матричной игры.

&#8195;&#8195; Для начала необходимо ввести матрицу, вы сможете сделать это ниже.

In [1]:
import pandas as pd
from IPython.display import HTML
import numpy as np

m=2
n=2
a = [[int(input()) for j in range(m)] for i in range(n)]
print(a)

1
0
-1
2
[[1, 0], [-1, 2]]


In [2]:
rows_cnt = len(a)
cols_cnt = len(a[0])
 
new_matix = [[0]*rows_cnt for _ in range(cols_cnt)]
 
for i in range(rows_cnt):
    for j in range(cols_cnt):
        new_matix[j][i] = a[i][j]

In [3]:
B = {
   'B1': new_matix[0],
    'B2': new_matix[1]
}
A = {'A1','A2'}


In [4]:
import pandas as pd
df = pd.DataFrame(data=B,index=A)

#### Шаг №1 Получение платежной матрицы.

In [5]:
def hover(hover_color="#ffff99"):
    return dict(selector="tr:hover",
                props=[("background-color", "%s" % hover_color)])

styles = [
    hover(),
    dict(selector="th", props=[("font-size", "120%"),
                               ("text-align", "center")]),
    dict(selector="caption", props=[("caption-side", "bottom")]),
    dict(selector="tr", props=[("font-size", "150%"),
                               ("text-align", "center")])
]
html = (df.style.set_table_styles(styles))
html

Unnamed: 0,B1,B2
A2,1,0
A1,-1,2


In [13]:
amins = []
for i in range(1,3):
    amins.append(df.loc["A"+str(i)].min())

bmaxs = []
for i in range(1,3):
    bmaxs.append(df["B"+str(i)].max())


In [7]:
df['a=min'] = amins
df.loc['b=max'] = bmaxs + [np.nan]

#### Шаг №2 Расчет максимальных и минимальных значений.

&#8195;&#8195; На данном этапе необходимо рассчитать минимальные значения для каждой строки в матрице, а также максимальные значения для каждого столбца в матрице.

In [8]:
html = (df.style.set_table_styles(styles))
html

Unnamed: 0,B1,B2,a=min
A2,1,0,-1.0
A1,-1,2,0.0
b=max,1,2,


#### Шаг №3 Поиск нижней и верхней цены игры

Для нахождения верхней  нижней цены игры требуется:
- Для нижней цены игры необходимо найти максимум среди минимальных в строках;
- Для верхней цены игры необходимо найти минимум среди максимумов по столбцам.

Седловая точка будет существовать только в том случае, если нижняя и верхняя границы равны.

In [9]:
sed_point = False

max_point = max(amins)
min_point = min(bmaxs)

print("Нижняя цена игры: " + str(max_point))
print("Верхняя цена игры: " + str(min_point))

if (max_point == min_point):
    print("Седловая точка существует, игра закончится в чистых стратегиях")
    print("Цена игры: " + str(max_point))
    sed_point = True
else:
    print("")
    print("Cедловой точки не существует, игра решится в смешанных стратегиях")

Нижняя цена игры: 0
Верхняя цена игры: 1

Cедловой точки не существует, игра решится в смешанных стратегиях


#### Шаг №4 Находим решение игры в смешанных стратегиях.
Запишем систему уравнений.
Для игрока 1:
\begin{equation*}
 \begin{cases}
   c_{11}p_1+c_{21}p_2=V, \\ 
   c_{12}p_1+c_{22}p_2=V, \\
   p_1+p_2=1,
 \end{cases}
\end{equation*}

Решение которой имеет вид:
\begin{equation*}
 \begin{cases}
   p_1=\frac{c_{22}-c_{21}}{c_{11}+c_{22}-c_{12}-c_{21}}, \\ 
   p_2=\frac{c_{11}-c_{12}}{c_{11}+c_{22}-c_{12}-c_{21}}, \\
   V=\frac{c_{11}\cdot c_{22}-c_{12}\cdot c_{21}}{c_{11}+c_{22}-c_{12}-c_{21}}, \\
 \end{cases}
\end{equation*}

Аналогичным образом можно найти оптимальную стратегию игрока 2:
\begin{equation*}
 \begin{cases}
   c_{11}q_1+c_{12}q_2=V, \\ 
   c_{21}q_1+c_{22}q_2=V, \\
   q_1+q_2=1, \\
 \end{cases}
\end{equation*}

Решение которой имеет вид:
\begin{equation*}
 \begin{cases}
   q_1=\frac{c_{22}-c_{12}}{c_{11}+c_{22}-c_{12}-c_{21}}, \\ 
   q_2=\frac{c_{11}-c_{21}}{c_{11}+c_{22}-c_{12}-c_{21}}, \\
   V=\frac{c_{11}\cdot c_{22}-c_{12}\cdot c_{21}}{c_{11}+c_{22}-c_{12}-c_{21}}, \\
 \end{cases}
\end{equation*}



#### Затем необходимо решить полученные системы уравнений и узнать стратегии игроков

In [10]:
if (sed_point == False):
    p1 = (a[1][1] - a[1][0])/(a[0][0]+a[1][1] - a[1][0] - a[0][1])
    p2 = (a[0][0] - a[0][1])/(a[0][0]+a[1][1] - a[1][0] - a[0][1])
    
    q1 = (a[1][1] - a[0][1])/(a[0][0]+a[1][1] - a[1][0] - a[0][1])
    q2 = (a[0][0] - a[1][0])/(a[0][0]+a[1][1] - a[1][0] - a[0][1])
    
    y = (a[0][0]*a[1][1] - a[0][1]*a[1][0])/(a[0][0]+a[1][1] - a[1][0] - a[0][1])

In [11]:
print("Ответ: y = "+ str(y))
print("Смешанные стратегии игрока №1: P(" + str(p1) + "," + str(p2) + ")")
print("Смешанные стратегии игрока №2: Q(" + str(q1) + "," + str(q2) + ")")

Ответ: y = 0.5
Смешанные стратегии игрока №1: P(0.75,0.25)
Смешанные стратегии игрока №2: Q(0.5,0.5)


In [12]:
import ipywidgets as widgets
from ipywidgets import interactive
from IPython.display import HTML

HTML('''<script>
code_show=true; 
function code_toggle() {
 if (code_show){
 $('div.input').hide();
 } else {
 $('div.input').show();
 }
 code_show = !code_show
} 
$( document ).ready(code_toggle);
</script>
<form action="javascript:code_toggle()"><input type="submit" value="Нажмите на кнопку чтобы увидеть код"></form>''')