## ライブラリ

In [2]:
import numpy as np
import pandas as pd
pd.set_option("display.unicode.east_asian_width", True)

## 期待値に基づく意思決定

In [3]:
# 利得行列
payoff = pd.DataFrame({
    "0台": [-100, -100], 
    "1台": [300, 300], 
    "2台": [700, -300]
})
payoff.index = ["好況", "不況"]
print(payoff)

      0台  1台  2台
好況 -100  300  700
不況 -100  300 -300


In [5]:
# 好況と不況の確率
prob_state = pd.Series([0.4, 0.6])
prob_state.index = ["好況", "不況"]
prob_state

好況    0.4
不況    0.6
dtype: float64

In [6]:
# 利得×確率
payoff.mul(prob_state, axis = 0)

Unnamed: 0,0台,1台,2台
好況,-40.0,120.0,280.0
不況,-60.0,180.0,-180.0


In [8]:
# 選択肢ごとの期待利得
emv = payoff.mul(prob_state, axis = 0).sum()
emv

0台   -100.0
1台    300.0
2台    100.0
dtype: float64

In [16]:
# 最大値を取るインデックスを取得する関数
def argmax_list(series):
  return list(series[series == series.max()].index)

In [17]:
# 期待利得が最大となる選択肢
argmax_list(emv)

['1台']

In [18]:
# 上記を関数にまとめる：期待利得最大化に基づく意思決定を行なう関数
def max_emv(probs, payoff_table):

  # 選択肢ごとの期待利得
  emv = payoff_table.mul(probs, axis = 0).sum()

  # 最大期待利得
  max_emv = emv.max()

  # 期待利得を最大化する選択肢
  a_star = argmax_list(emv)

  # 出力
  return pd.Series([a_star, max_emv], index = ["選択肢", "期待利得"])

In [19]:
# max_emv関数による意思決定
max_emv(prob_state, payoff)

選択肢      [1台]
期待利得    300.0
dtype: object

## 期待値のシミュレーション

In [37]:
# 乱数生成：確率0.4で700が，確率0.6で-300が出る乱数
np.random.seed(1)
print(np.random.choice([700, -300], size = 10, p = [0.4, 0.6]))
np.random.seed(1)
print(np.random.choice([700, -300], size = 10, p = [0.4, 0.6]))

[-300 -300  700  700  700  700  700  700  700 -300]
[-300 -300  700  700  700  700  700  700  700 -300]


In [38]:
# 500万個の乱数生成
np.random.seed(1)
simulation = np.random.choice([700, -300], size = 5000000, p = [0.4, 0.6])

In [42]:
# 期待値と平均値
print("期待値：", np.sum(np.array([700, -300]) * np.array([0.4, 0.6])))
print("平均値：", simulation.mean().round(1))

期待値： 100.0
平均値： 100.0
