> 当赢得矩阵中不存在鞍点时，在只使用纯策略的范围内，博弈问题无解。因此引进零和博弈的混合策略

---
### 16.3.1 零和博弈的混合策略
设局中人Ⅰ用概率 $x_i$ 选用策略 $\alpha_i$，局中人Ⅱ用概率 $y_i$ 选用策略 $\beta_i$

Ⅰ的混合策略 $S_1^*=\left\{[x_1,\cdots,x_m]^{\rm T}\ \vert\ x_i\geq0,i=1,\cdots,m;\sum\limits_{i=1}^mx_i=1\right\}$

Ⅱ的混合策略 $S_2^*=\left\{[y_1,\cdots,y_n]^{\rm T}\ \vert\ y_j\geq0,j=1,\cdots,m;\sum\limits_{j=1}^my_j=1\right\}$

**定义**：若存在 $m$ 维概率向量 $\bar{\boldsymbol x}$ 和 $n$ 维概率向量 $\bar{\boldsymbol y}$，使得对一切 $m$ 维概率向量 $\boldsymbol x$ 和 $n$ 维概率向量 ${\boldsymbol y}$，有
$$
\bar{\boldsymbol x}^{\rm T}{\boldsymbol A}\bar{\boldsymbol y}=\max_{\boldsymbol x}{\boldsymbol x}^{\rm T}{\boldsymbol A}\bar{\boldsymbol y}=\min_{\boldsymbol y}\bar{\boldsymbol x}^{\rm T}{\boldsymbol A}{\boldsymbol y}
$$
则称 $(\bar{\boldsymbol x},\bar{\boldsymbol y})$ 为混合策略博弈问题的鞍点

**定理**：设 $\bar {\boldsymbol x}\in S_1^*,\bar {\boldsymbol y}\in S_2^*$，则 $(\bar {\boldsymbol x},\bar {\boldsymbol y})$ 为 $G=\{S_1,S_2;\boldsymbol A\}$ 的解的充要条件是
$$
\begin{cases}
\sum\limits_{j=1}^na_{ij}\bar y_j\leq\bar{\boldsymbol x}^{\rm T}{\boldsymbol A}\bar{\boldsymbol y},\quad &i=1,2,\cdots,m\\
\sum\limits_{i=1}^na_{ij}\bar x_i\geq\bar{\boldsymbol x}^{\rm T}{\boldsymbol A}\bar{\boldsymbol y},\quad &j=1,2,\cdots,n
\end{cases}
$$

**定理**：任意混合策略博弈问题必存在鞍点，即必存在概率向量 $\bar{\boldsymbol x}$ 和 $\bar{\boldsymbol y}$，使得
$$
\bar{\boldsymbol x}^{\rm T}{\boldsymbol A}\bar{\boldsymbol y}=\max_{\boldsymbol x}\ \min_{\boldsymbol y}\ {\boldsymbol x}^{\rm T}{\boldsymbol A}{\boldsymbol y}=\min_{\boldsymbol y}\ \max_{\boldsymbol x}\ {\boldsymbol x}^{\rm T}{\boldsymbol A}{\boldsymbol y}
$$

### 16.3.2 零和博弈的解法
#### 1. 线性方程组方法
假设最优策略中的 $x_i^*$ 和 $y_j^*$ 均不为零，则把求解博弈问题转化为求方程组
$$
\begin{align*}
    &\begin{cases}
    \sum\limits_{i=1}^m=a_{ij}x_i\quad j=1,2,\cdots,n\\
    \sum\limits_{i=1}^m=1\\
    \end{cases}
\\
    &\begin{cases}
    \sum\limits_{j=1}^na_{ij}y_j=v,\quad i=1,2,\cdots,m\\
    \sum\limits_{j=1}^ny_j=1
    \end{cases}
\end{align*}
$$
的非负解 $\boldsymbol x^*, \boldsymbol y^*$。式中 $u$ 为局中人Ⅰ的赢得，$v$ 是局中人Ⅱ的支付
> **局限性**：由于事先假设 $x^*_i,y^*_j$ 均不为零，故当最优策略的某些分量实际为零时，上述方程组可能无解。但对于 $2\times 2$ 的矩阵，恒可以用方程组方法进行求解

#### 田忌赛马问题

In [1]:
import numpy as np
import sympy as sp

n = 6
A = np.eye(n)*2 + np.ones((n, n))
A[0, 5] = A[1, 4] = A[2, 1] = A[3, 0] = A[4, 2] = A[5, 3] = -1
A = A.astype(int)
Az1 = np.hstack([A.T, -np.ones((6, 1))])    # A.T  @ x - U
Az2 = np.vstack([Az1, [[1]*6 +[0]]])        # add sum(x)
B = np.hstack([np.zeros(6), 1]).reshape(7, 1)   # 常数项
Az3 = np.hstack([Az2, B])
Az4 = sp.Matrix(Az3.astype(int))

Az4     # 1~6 列：x的系数；7列：u的系数；8列：常数项
        # 1~6 行：A.T x - U = 0；7行：sum(x)=1

Matrix([
[ 3,  1,  1, -1,  1,  1, -1, 0],
[ 1,  3, -1,  1,  1,  1, -1, 0],
[ 1,  1,  3,  1, -1,  1, -1, 0],
[ 1,  1,  1,  3,  1, -1, -1, 0],
[ 1, -1,  1,  1,  3,  1, -1, 0],
[-1,  1,  1,  1,  1,  3, -1, 0],
[ 1,  1,  1,  1,  1,  1,  0, 1]])

In [2]:
s1 = Az4.rref()
s1[0]      # 行最简形

Matrix([
[1, 0, 0, 0, 0, -1, 0,   0],
[0, 1, 0, 0, 0,  1, 0, 1/3],
[0, 0, 1, 0, 0,  1, 0, 1/3],
[0, 0, 0, 1, 0, -1, 0,   0],
[0, 0, 0, 0, 1,  1, 0, 1/3],
[0, 0, 0, 0, 0,  0, 1,   1],
[0, 0, 0, 0, 0,  0, 0,   0]])

In [3]:
s2 = np.linalg.pinv(Az2) @ B
s2          # 最小范数解

array([[0.16666667],
       [0.16666667],
       [0.16666667],
       [0.16666667],
       [0.16666667],
       [0.16666667],
       [1.        ]])

In [4]:
s2[-1]      # 局中人Ⅰ赢得的期望

array([1.])

#### 2. 线性规划解法
当 $m>2$ 且 $n>2$ 时，通常采用线性规划方法求解零和博弈问题

$\bar{\boldsymbol x}$ 应为线性规划问题
$$
\begin{align*}
&\max u\\
&{\rm s.t.}
    \begin{cases}
    \sum\limits_{i=1}^ma_{ij}x_i\geq u,\quad j=1,2,\cdots,n\\[2ex]
    \sum\limits_{i=1}^mx_i=1\\[2ex]
    x_i\geq 0,\quad i=1,2,\cdots,m
    \end{cases}
\end{align*}
$$
的解，同理，$\bar{\boldsymbol y}$ 应为线性规划
$$
\begin{align*}
&\min v\\
&{\rm s.t.}
    \begin{cases}
    \sum\limits_{j=1}^ma_{ij}y_j\geq v,\quad i=1,2,\cdots,m\\[2ex]
    \sum\limits_{j=1}^my_j=1\\[2ex]
    y_j\geq 0,\quad j=1,2,\cdots,n
    \end{cases}
\end{align*}
$$
的解。易见两个规划互为对偶线性规划，它们具有相同的最优目标函数值

#### 重解田忌赛马

In [5]:
import cvxpy as cp

A = np.loadtxt('../../16第16章  博弈论/data16_3.txt')
x = cp.Variable(6, nonneg=True)
y = cp.Variable(6, nonneg=True)
u = cp.Variable()
v = cp.Variable()

obj1 = cp.Maximize(u)
cons1 = [
    A.T @ x >= u,   # aij*xi 每列的和 >= u
    cp.sum(x) == 1,
]
prob1 = cp.Problem(obj1, cons1)
prob1.solve(solver='GUROBI')
print("最优解：", x.value)
print("最优值：", prob1.value)

最优解： [0.33333333 0.         0.         0.33333333 0.         0.33333333]
最优值： 1.0


In [6]:
obj2 = cp.Minimize(v)
cons2 = [
    A @ y <= v,   # aij*yj 每行的和 <= v
    cp.sum(y) == 1,
]
prob2 = cp.Problem(obj2, cons2)
prob2.solve(solver='GUROBI')
print("最优解：", y.value)
print("最优值：", prob2.value)

最优解： [0.33333333 0.         0.         0.33333333 0.         0.33333333]
最优值： 1.0000000000000002


#### 军事对抗

In [7]:
# 甲方的赢得矩阵 = 甲方赢得的可能性矩阵 - 乙方赢得的可能性矩阵
A = np.array([[1/3,1/2,-1/3],[-2/5,1/5,-1/2],[1/2,-3/5,1/3]]) 
x = cp.Variable(3, nonneg=True)
y = cp.Variable(3, nonneg=True)
u = cp.Variable()
v = cp.Variable()

obj1 = cp.Maximize(u)
cons1 = [
    A.T @ x >= u,   # aij*xi 每列的和 >= u
    cp.sum(x) == 1,
]
prob1 = cp.Problem(obj1, cons1)
prob1.solve(solver='GUROBI')
print("最优解：", x.value)
print("最优值：", prob1.value)

最优解： [0.52830189 0.         0.47169811]
最优值： -0.018867924528301938


In [8]:
obj2 = cp.Minimize(v)
cons2 = [
    A @ y <= v,   # aij*yj 每行的和 <= v
    cp.sum(y) == 1,
]
prob2 = cp.Problem(obj2, cons2)
prob2.solve(solver='GUROBI')
print("最优解：", y.value)
print("最优值：", prob2.value)

最优解： [0.         0.37735849 0.62264151]
最优值： -0.018867924528301855


甲方的期望赢得为负，乙方略微处于有利位置