In [1]:
from IPython.display import HTML

HTML('''<script>
code_show=true; 
function code_toggle() {
 if (code_show){
 $('div.input').hide();
 } else {
 $('div.input').show();
 }
 code_show = !code_show
} 
$( document ).ready(code_toggle);
</script>
<form action="javascript:code_toggle()"><input type="submit" value="Нажмите на кнопку чтобы увидеть код"></form>''')

### Принцип минимакса в решении игровых задач

#### Основные понятия

&#8195;&#8195; Во многих практических задачах возникают ситуации, когда требуется принять решение, не имея достаточной информации. Неизвестными могут быть как условия осуществления какой-либо операции, так и сознательные действия лиц, от которых зависит успех этой операции.

&#8195;&#8195; Матричной игрой называется игра, осуществляемая по следующим правилам:
- В игре участвуют два игрока;
- Каждый из игроков обладает конечным набором стратегий;
- Игра заключается в том, что каждый из игроков, не имея информации о действиях противника, делает один ход (выбирает одну из своих стратегий). Результатом выбора игроками стратегий является выигрыш и проигрыш в игре.
- И выигрыш, и проигрыш выражаются числами.

#### Матричная игра с нулевой суммой

&#8195;&#8195; Матричная игра называется игрой с нулевой суммой, если в этой игре выигрыш одного игрока равняется проигрышу другого игрока.
        
&#8195;&#8195; Каждая матричная игра с нулевой суммой имеет платежную матрицу. Для того чтобы построить эту матрицу, обозначим одного из игроков символом A, а другого - символом B, и предположим, что $A_1$, $A_2$, ..., $A_m$ - стратегии, которые может применять игрок A, а $B_1$, $B_2$, ..., $B_n$ - стратегии, которые может применять игрок B.

&#8195;&#8195; Матричная игра, в которой у игрока A имеется m стратегий, а у игрока B - n стратегий, называется игрой типа m$\times$n.

#### Нижняя и верхняя цена игры. Принцип минимакса

Рассмотрим матричную игру типа m$\times$n с платежной матрицей 
        \begin{array}{cccc}
            c_{11} & c_{12} & \ldots & c_{1n}\\
            c_{21} & c_{22} & \ldots & c_{2n}\\
            \vdots & \vdots & \ddots & \vdots\\
            c_{m1} & c_{m2} & \ldots & c_{mn}
        \end{array}
        
&#8195;&#8195; Если игрок A выберет стратегию $A_i$, то все его возможные выигрыши будут элементами i-й строки матрицы C. В наихудшем для игрока A случае, когда игрок B применяет стратегию, соответствующую минимальному элементу этой строки, выигрыш игрока A будет равен числу min $c_{ij}$, 1$\leq$j$\leq$n.
    
&#8195;&#8195; Следовательно, для получения наибольшего выигрыша, игроку A нужно выбирать ту из стратегий, для которой число min $c_{ij}$ (1$\leq$j$\leq$n) максимально. Это значение принятно считать нижней ценой игры.

&#8195;&#8195;  Следовательно, игроку B нужно выбрать такую стратегию, для которой число max $c_{ij}$ (1$\leq$i$\leq$m) минимально. Это значение принято называть верхней ценой игры.

#### Игры с седловой точкой

Игра называется игрой с седловой точкой, если ее нижняя и верхняя цены совпадают, то есть выполняется равенство
    
&#8195;&#8195; $\alpha$=max min $c_{ij}$=min max $c_{ij}$=$\beta$, 1$\leq$i$\leq$m, 1$\leq$j$\leq$n
    
Для игры с седловой точкой общее значение нижней и верхней цены игры
    
&#8195;&#8195; V=$\alpha$=$\beta$

называется ценой игры. Если седловая точка существует, то игра заканчивается после нахождения цены игры.

&#8195;&#8195; Если селовая точка отсутствует, то в чистых стратегиях рассматриваемая игра не разрешима. Значит, результат этой игры определится в смешанных стратегиях.

#### Теперь перейдем к практическому решению матричной игры.

&#8195;&#8195; Для начала необходимо ввести матрицу, вы сможете сделать это ниже.

In [2]:
import pandas as pd
import numpy as np

from IPython.display import HTML
from numpy import linalg as LA

from IPython.core.display import Javascript, display

print("Введите количество строк в матрице '2 или 3'")
n=int(input())

print("Введите матрицу")
a = [[int(j) for j  in input().split()] for i in range(n)]

mat = np.array(a)
A = []     #Индексы для строк df
B = {}     #Индексы для столбцов df
student_points = 0

columnsList = []
columnsList1 = []

Введите количество строк в матрице '2 или 3'
3
Введите матрицу
5 -1 -2
6 2 -3
7 -3 -4


In [3]:
def toFixed(f: float, n=0):
    a, b = str(f).split('.')
    return '{}.{}{}'.format(a, b[:n], '0'*(n-len(b)))


def invert_matrix():
    
    rows_cnt = len(a)
    cols_cnt = len(a[0])

    new_matix = [[0]*rows_cnt for _ in range(cols_cnt)]

    for i in range(rows_cnt):
        for j in range(cols_cnt):
            new_matix[j][i] = a[i][j]
    
    return new_matix


def delete_cols(mat,columnsList,columnsList1):
    
    check = 0

    for i in range(len(mat[0])):

        for j in range(i+1,len(mat[0])):

            if (len(columnsList)<6):

                for k in range(len(mat)):

                    if (mat[k][i] >= mat[k][j]):
                        check = check + 1
                    else:
                        check = 0
                        break

                if (check == len(mat)):
                    columnsList.append(i)
                    check = 0
                    break;

    check = 0               

    for i in range(len(mat[0])):

        for j in range(i+1,len(mat[0])):

            if (len(columnsList1)<6):

                for k in range(len(mat)):

                    if (mat[k][j] >= mat[k][i]):
                        check = check + 1
                    else:
                        check = 0
                        break


                if (check == len(mat)):
                    columnsList1.append(j)
                    check = 0
                    break;
    S = []
    
    if columnsList and columnsList1:
        temp = np.hstack((columnsList, columnsList1))
        temp = np.unique(temp)
        temp = np.resize(temp, (len(mat[0])-3))
        S = np.delete(mat, temp, 1)
        S = np.transpose(S, axes = None)
        A = ['A'+str(i+1) for i in range(n)]
        B = {'B'+str(i+1): S[i] for i in range(len(S))}

    else:
        if columnsList1:
            temp = np.resize(columnsList1, (len(mat[0])-3))
            S = np.delete(mat, temp, 1)
            S = np.transpose(S, axes=None)
            A = ['A'+str(i+1) for i in range(n)]
            B = {'B'+str(i+1): S[i] for i in range(len(S))}


        if columnsList:
            temp = np.resize(columnsList, (len(mat[0])-3))
            S = np.delete(mat, temp, 1)
            S = np.transpose(S, axes=None)
            A = ['A'+str(i+1) for i in range(n)]
            B = {'B'+str(i+1): S[i] for i in range(len(S))}
            
    return S

def game2x2():
    
    p1 = (a[1][1] - a[1][0])/(a[0][0]+a[1][1] - a[1][0] - a[0][1])
    p2 = (a[0][0] - a[0][1])/(a[0][0]+a[1][1] - a[1][0] - a[0][1])
    
    q1 = (a[1][1] - a[0][1])/(a[0][0]+a[1][1] - a[1][0] - a[0][1])
    q2 = (a[0][0] - a[1][0])/(a[0][0]+a[1][1] - a[1][0] - a[0][1])
    
    y = (a[0][0]*a[1][1] - a[0][1]*a[1][0])/(a[0][0]+a[1][1] - a[1][0] - a[0][1])
    
    print("Ответ: y = "+ str(toFixed(y, 2)))
    print("Смешанные стратегии игрока №1: P(" + str(toFixed(p1, 1)) + "," + str(toFixed(p2, 1)) + ")")
    print("Смешанные стратегии игрока №2: Q(" + str(toFixed(q1, 1)) + "," + str(toFixed(q2, 1)) + ")")
    
def find_first_p(temp):

    right_side = np.array([[0], [0], [0],[1]])
    bottom_add = np.array([1,1,1])
    minus_y = np.array([[-1],[-1],[-1],[0]])

    bottom_add = bottom_add.reshape(1,3)
    minus_y = minus_y.reshape(4,1)
    right_side = right_side.reshape(4,1)
    
    temp_matrix = np.concatenate([temp, bottom_add], axis = 0)
    temp_matrix = np.concatenate([temp_matrix, minus_y], axis = 1)

    x = LA.solve(temp_matrix, right_side)
    return x

def find_second_p(temp):

    right_side = np.array([[0], [0], [0],[1]])
    bottom_add = np.array([1,1,1])
    minus_y = np.array([[-1],[-1],[-1],[0]])
    
    bottom_add = bottom_add.reshape(1,3)
    minus_y = minus_y.reshape(4,1)
    right_side = right_side.reshape(4,1)

    temp_matrix1 = np.transpose(temp, axes = None)
    temp_matrix1 = np.concatenate([temp_matrix1, bottom_add], axis = 0)
    temp_matrix1 = np.concatenate([temp_matrix1, minus_y], axis = 1)

    x1 = LA.solve(temp_matrix1, right_side)
    return x1

#### Шаг №1 Получение платежной матрицы.

In [4]:
pd.set_option('precision', 0)
invert_m = invert_matrix() 
A = ['A'+str(i+1) for i in range(n)]
B = {'B'+str(i+1): invert_m[i] for i in range(len(invert_m))}
df = pd.DataFrame(index=A,data=B)

In [5]:
# Стилизация датафрейма

def hover(hover_color="#ffff99"):
    
    return dict(selector="tr:hover",
                props=[("background-color", "%s" % hover_color)])

styles = [
    dict(selector="th", props=[("font-size", "120%"),
                               ("text-align", "center")]),
    dict(selector="caption", props=[("caption-side", "bottom")]),
    dict(selector="tr", props=[("font-size", "150%"),
                               ("text-align", "center")])
]
html = (df.style.set_table_styles(styles))
display(html)

Unnamed: 0,B1,B2,B3
A1,5,-1,-2
A2,6,2,-3
A3,7,-3,-4


#### Шаг №2 Расчет максимальных и минимальных значений.

&#8195;&#8195; На данном этапе необходимо рассчитать минимальные значения для каждой строки в матрице, а также максимальные значения для каждого столбца в матрице.

In [6]:
if (len(a[0]) <= 3):
    amins = []
    for i in range(1,len(A)+1):
        amins.append(int(df.loc["A"+str(i)].min()))

    bmaxs = []
    for i in range(1,len(invert_m)+1):
        bmaxs.append(int(df["B"+str(i)].max()))

    df['a=min'] = amins
    df.loc['b=max'] = bmaxs + [np.nan]

    print("Введите значения по столбцам")
    check_cols = list(map(int, input().split()))
    print('Введите значения по строкам')
    check_rows = list(map(int, input().split()))

    if (check_cols == bmaxs and check_rows == amins):

        student_points =+ 1
        print('')
        print('Вы ввели корректные значения')


Введите значения по столбцам
-2 -3 -4
Введите значения по строкам
7 -5 -2


In [7]:
# Перерисовка датафрейма с настроенными стилями

if (len(a[0]) <= 3):
    html = (df.style.set_table_styles(styles))
    display(html)

Unnamed: 0,B1,B2,B3,a=min
A1,5,-1,-2,-2.0
A2,6,2,-3,-3.0
A3,7,-3,-4,-4.0
b=max,7,2,-2,


#### Но если матрица в введенном вами примере имеет размерность 3xN, где N > 3, то перед вычислением минимальных и максимальных значений по строкам и столбцам необходимо убрать доминирующие столбцы. Как это сделать подробно описанно в лекционных материалах.

После отсеивания доминирующих столбцов, у нас получилась следующая матрица:

In [8]:
if (len(a[0]) > 3):
    temp = delete_cols(mat,columnsList,columnsList1)
    A = ['A'+str(i+1) for i in range(n)]
    B = {'B'+str(i+1): temp[i] for i in range(len(temp))}
    df = pd.DataFrame(index=A,data=B)
    html = (df.style.set_table_styles(styles))
    display(html)

Теперь требуется выполнить те же действия, что были указаны в начале второго шага. А именно рассчитать минимальные значения для каждой строки в матрице, а также максимальные значения для каждого столбца в матрице.

In [9]:
if (len(a[0]) > 3):
    amins = []
    for i in range(1,len(A)+1):
        amins.append(int(df.loc["A"+str(i)].min()))

    bmaxs = []
    for i in range(1,len(temp)+1):
        bmaxs.append(int(df["B"+str(i)].max()))

    df['a=min'] = amins
    df.loc['b=max'] = bmaxs + [np.nan]
        
    html = (df.style.set_table_styles(styles))
    print(amins,bmaxs)
    display(html)

#### Шаг №3 Поиск нижней и верхней цены игры

Для нахождения верхней  нижней цены игры требуется:
- Для нижней цены игры необходимо найти максимум среди минимальных в строках;
- Для верхней цены игры необходимо найти минимум среди максимумов по столбцам.

Седловая точка будет существовать только в том случае, если нижняя и верхняя границы равны.

In [10]:
sed_is_true = 999

max_point = max(amins)
min_point = min(bmaxs)

if (max_point == min_point):
    sed_is_true = min_point
else:
    sed_is_true = 0
    
print ('Введите седловую точку, если она существует, иначе введите 0')

check_sed = int(input())

if (check_sed == sed_is_true):
    
    student_points =+ 1
    print("Ваш ответ правильный!")

Введите седловую точку, если она существует, иначе введите 0
2


In [11]:
# проверка на седловую точку

sed_point = False

max_point = max(amins)
min_point = min(bmaxs)

print("Нижняя цена игры: " + str(max_point))
print("Верхняя цена игры: " + str(min_point))

if (max_point == min_point):
    print("Седловая точка существует, игра закончится в чистых стратегиях")
    print("Цена игры: " + str(max_point))
    sed_point = True
else:
    print("")
    print("Cедловой точки не существует, игра решится в смешанных стратегиях")

Нижняя цена игры: -2
Верхняя цена игры: -2
Седловая точка существует, игра закончится в чистых стратегиях
Цена игры: -2


#### Если решения игры в чистых стратегиях не существует, то применяются смешанные. О них вы также сможете прочитать в лекционных материалах.

&#8195;&#8195; Для того чтобы найти решение в смешанных стратегиях, необходимо составить систему линейных неравенств из получившейся на данном этапе матрицы. Когда система будет решена, вы сможете найсти стратегии каждого игрока, а также цену игры.

In [12]:
if (sed_point == False and n == 2):
    game2x2()

In [13]:
if (sed_point == False and n == 3):
    marker1 = True
    marker2 = True

    temp = delete_cols(mat,columnsList,columnsList1)
    player_1 = find_first_p(temp)
    player_1 = np.resize(player_1, (1, 4))
    player_1 = player_1[0]

    player_2 = find_second_p(temp)
    player_2 = np.resize(player_1, (1, 4))
    player_2 = player_2[0]

    for i in range(3):
        if (player_1[i] < 0):
            marker1 = False
        if (player_2[i] < 0):
            marker2 = False

    if (marker1 == False or marker2 == False ):
        print("Вероятность стратегии отрицательная, решение данным способом получить невозможно")

        print("y = "+ str(toFixed(player_1[3], 1)))
        print("Смешанные стратегии игрока №1: P(" + str(toFixed(player_1[0], 2)) + "," + str(toFixed(player_1[1], 1)) + "," + str(toFixed(player_1[2], 1)) + ")")
        print("Смешанные стратегии игрока №2: Q(" + str(toFixed(player_2[0], 1)) + "," + str(toFixed(player_2[1], 1)) + "," + str(toFixed(player_2[2], 1)) + ")")

    else:

        print("y = "+ str(toFixed(player_1[3], 1)))
        print("Смешанные стратегии игрока №1: P(" + str(toFixed(player_1[0], 2)) + "," + str(toFixed(player_1[1], 1)) + "," + str(toFixed(player_1[2], 1)) + ")")
        print("Смешанные стратегии игрока №2: Q(" + str(toFixed(player_2[0], 1)) + "," + str(toFixed(player_2[1], 1)) + "," + str(toFixed(player_2[2], 1)) + ")")

In [14]:
import ipywidgets as widgets
from ipywidgets import Button, Layout
print("Введите ФИО, номер группы и код доступа")
name = widgets.Text(placeholder='ФИО',description='',disabled=False)
key = widgets.Text(placeholder='Код доступа',description='',disabled=False)
display(name,key)
def send_clicked():
    key_tmp = int(key.value)
    name_tmp = name.value
    if(key_tmp==1234):
        key.value = ""
        name.value = ""
        !jupyter nbconvert --config config.py Game_theory_minmax.ipynb
        print("Данные отправлены! Спасибо!")
    else:
        print("Неверный код доступа")
    
im = widgets.interact_manual(send_clicked);
im.widget.children[0].description = 'Отправить'
im.widget.children[0].layout = Layout(width='30%')

Введите ФИО, номер группы и код доступа


Text(value='', placeholder='ФИО')

Text(value='', placeholder='Код доступа')

interactive(children=(Button(description='Run Interact', style=ButtonStyle()), Output()), _dom_classes=('widge…