# 게임이론 Game Theory

## Ⅰ 개요

게임 이론은 경제학, 수학, 정치학 등 다양한 분야에서 사용되는 이론으로, 여러 의사결정자가 상호작용하는 상황에서 각자가 최적의 결정을 내리는 방법을 연구합니다. 이 이론은 주체들(플레이어)이 서로의 선택을 예측하며 자신의 이익을 극대화하는 전략을 구상하는 상황을 다룹니다. 게임 이론은 협력적인 경우도 있고, 경쟁적인 경우도 있습니다.

### 1. 기본 개념

**게임 Game**: 주체들이 상호작용하면서 선택을 내리는 상황입니다. 게임은 주로 두 가지 종류로 나뉩니다.

- **협력적 게임 Cooperative Game**: 주체들이 서로 협력하여 이익을 나눕니다.
- **비협력적 게임 Non-cooperative Game**: 각 주체가 자신의 이익을 극대화하려고 합니다.

**플레이어 Player**: 게임에 참여하는 의사결정자입니다. 플레이어들은 서로의 전략을 고려하여 행동을 결정합니다.

**전략 Strategy**: 플레이어가 게임 내에서 선택할 수 있는 행동 계획입니다. 각 플레이어는 여러 전략 중 하나를 선택할 수 있습니다.

**보수 Payoff**: 플레이어가 특정 전략을 선택했을 때 얻는 이익입니다. 보수는 다른 플레이어의 전략 선택에 따라 달라질 수 있습니다.

**전략적 상호작용 Strategic Interaction**: 한 플레이어의 결정이 다른 플레이어의 보수에 영향을 미치고, 그 반대도 마찬가지입니다.

### 2. 게임의 분류

게임 이론은 여러 가지 방식으로 분류할 수 있습니다.

- **동시 게임 Simultaneous Game**: 모든 플레이어가 동시에 결정을 내리고, 서로의 선택을 알 수 없습니다.
- **순차 게임 Sequential Game**: 한 플레이어가 먼저 결정을 내리고, 그 결정이 다음 플레이어에게 영향을 미칩니다.
- **제로섬 게임 Zero-sum Game**: 한 플레이어의 이득이 다른 플레이어의 손실과 정확히 같아, 총합이 0이 되는 게임입니다.
- **비제로섬 게임 Non-zero-sum Game**: 모든 플레이어가 동시에 이익을 얻거나 손해를 볼 수 있습니다.


### 3. 내쉬 균형 Nash Equilibrium

내쉬 균형은 비협력적 게임에서 가장 중요한 개념입니다. 내쉬 균형은 각 플레이어가 자신의 전략을 바꿔도 이익이 증가하지 않는 상태입니다.

#### 내쉬 균형 공식:

$$
u_i(s_i^*, s_{-i}^*) \geq u_i(s_i, s_{-i}^*)
$$

- u_i: 플레이어 i의 보수 함수
- s_i^*: 플레이어 i의 최적 전략
- s_{-i}^*: 다른 플레이어들의 최적 전략 집합
- s_i: 플레이어 i의 임의의 전략

이 공식은 플레이어 i가 최적 전략 s_i^*를 선택했을 때, 그 보수 u_i가 다른 임의의 전략 s_i를 선택했을 때의 보수보다 크거나 같음을 의미합니다.


### 4. 미니맥스 정리 Minimax Theorem

미니맥스 정리는 제로섬 게임에서 사용되며, 플레이어가 자신의 손실을 최소화하는 동시에 상대방의 최선의 반응을 고려해 전략을 결정하는 방법입니다.

$$
min_{x ∈ X} max_{y ∈ Y} u(x, y)
$$

- X, Y: 각 플레이어의 전략 공간
- u(x, y): 플레이어 1의 보수, 플레이어 2의 손실


### 5. 셰이플리 값 Shapley Value

셰이플리 값은 협력적 게임에서 각 플레이어가 협력에 기여한 만큼의 공정한 보수를 계산하는 방법입니다. 셰이플리 값은 각 플레이어가 협력에 기여한 모든 경우의 수를 고려해 평균적으로 얼마나 기여했는지를 계산합니다.

#### 셰이플리 값 공식:

$$
\phi_i(v) = \sum_{S ⊂ N \ i} \frac{|S|!(|N| - |S| - 1)!}{|N|!} [v(S ∪ i) - v(S)]
$$

- N: 플레이어들의 집합
- v(S): 집합 S가 얻은 보수
- ϕ_i(v): 플레이어 i의 셰이플리 값
- |S|: 집합 S의 크기


### 6. 게임 이론의 예시: 죄수의 딜레마 Prisoner's Dilemma

죄수의 딜레마는 두 명의 죄수가 각각 자백할지 말지를 결정하는 상황을 나타냅니다. 상대방의 선택에 따라 서로의 보수가 달라집니다.

| 죄수 B: 자백 | 죄수 B: 침묵 |
|---------------|---------------|
| 죄수 A: 자백  | (5, 5)        | (0, 10)      |
| 죄수 A: 침묵  | (10, 0)       | (1, 1)       |



## Ⅱ 게임 이론과 통계, 그리고 머신러닝

게임 이론은 특히 다중 에이전트 학습, 강화학습, 모델 해석에 적용되며, 이 과정에서 통계적 개념과 머신러닝 알고리즘이 긴밀하게 연결됩니다. 여기서는 통계와 머신러닝 관점에서 게임 이론의 핵심 개념과 그 응용을 살펴보겠습니다.

### 1. 게임 이론의 통계적 관점

#### 베이지안 게임:
통계적 관점에서 불확실성을 고려한 게임을 베이지안 게임이라고 합니다. 이 게임에서는 플레이어가 불완전한 정보를 바탕으로 행동하며, 통계적 기법을 통해 상대방의 전략에 대한 확률적 신념을 형성합니다.

#### 베이지안 업데이트:
통계적으로 각 플레이어는 데이터(상대방의 행동)를 기반으로 자신의 신념을 업데이트합니다. 이 과정을 통해 상대방이 선택할 전략에 대한 확률 분포를 개선하며 최적의 전략을 찾아냅니다.

#### 베이지안 정리 공식:

$$
P(A|B) = \frac{P(B|A) \cdot P(A)}{P(B)}
$$

여기서:
- **P(A|B)**: 증거 B가 주어졌을 때 A가 참일 확률
- **P(A)**: 사전 확률
- **P(B|A)**: A가 참일 때 B가 발생할 확률
- **P(B)**: 증거 B의 확률

이 공식은 게임 이론에서 불확실한 상황에서 신념을 업데이트하는 데 사용됩니다.


### 2. 머신러닝에서의 게임 이론

게임 이론은 머신러닝에서 여러 에이전트가 상호작용하는 환경을 모델링하거나, 강화학습과 같이 에이전트가 환경과 상호작용하며 최적 전략을 학습하는 데 활용됩니다.

#### (1) 생성적 적대 신경망 (GANs)
게임 이론의 **미니맥스 원칙**은 GANs(Generative Adversarial Networks)에서 중요한 역할을 합니다. GAN에서는 **생성자(Generator)**와 **판별자(Discriminator)**라는 두 네트워크가 서로 경쟁하는 구조를 갖습니다. 이 게임에서는 생성자가 가짜 데이터를 만들고, 판별자가 그 데이터가 가짜인지 진짜인지를 구분합니다.

#### 미니맥스 목표 함수:
GAN에서는 미니맥스 게임의 목표 함수가 다음과 같이 표현됩니다.

$$
\min_G \max_D V(D, G) = E_{x \sim p_{data}(x)} [\log D(x)] + E_{z \sim p_z(z)} [\log(1 - D(G(z)))]
$$

여기서:
- **D(x)**: 판별자가 진짜 데이터 x를 진짜로 판별할 확률
- **G(z)**: 생성자가 잠재 공간 z에서 생성한 가짜 데이터
- **p_data(x)**: 진짜 데이터의 확률 분포
- **p_z(z)**: 잠재 공간의 확률 분포

#### (2) 강화학습 (Reinforcement Learning)
강화학습에서 에이전트는 환경과 상호작용하며 최적의 정책을 학습합니다. 게임 이론은 다중 에이전트 강화학습에서 중요한 역할을 합니다. 여러 에이전트가 상호작용하는 경우, 게임 이론의 **내쉬 균형(Nash Equilibrium)**과 같은 개념을 통해 에이전트들이 각자의 최적 행동을 찾습니다.

- **Q-learning**: 강화학습에서 게임 이론적 요소가 Q-learning과 같은 알고리즘에 적용됩니다. 각 에이전트는 상태-행동 쌍에 대한 보상 값을 업데이트하며, 상대 에이전트의 행동을 고려해 최적의 정책을 학습합니다.

#### (3) 멀티 에이전트 시스템 (Multi-Agent Systems)
머신러닝에서 여러 에이전트가 동시에 상호작용하는 환경에서는 게임 이론이 각 에이전트가 어떻게 행동해야 최적의 결과를 얻을 수 있는지를 설명합니다. 특히 협력적 또는 경쟁적인 환경에서 에이전트는 각자의 목표를 달성하기 위해 게임 이론적 전략을 따르게 됩니다.

- **내쉬 균형**: 멀티 에이전트 시스템에서 내쉬 균형은 각 에이전트가 자신의 전략을 바꿔도 더 이상 이익이 증가하지 않는 상태입니다. 각 에이전트는 다른 에이전트들의 전략에 대응해 자신에게 최적인 행동을 선택합니다.

### 3. 머신러닝 모델 해석과 셰이플리 값

게임 이론의 **셰이플리 값(Shapley Value)**은 협력적 게임에서 각 플레이어가 기여한 공정한 가치를 계산하는 방법으로, 머신러닝의 모델 해석에 중요한 도구로 사용됩니다.

#### 모델 해석 (Model Interpretability):
복잡한 머신러닝 모델의 예측 결과를 해석하는 방법 중 하나로, 셰이플리 값이 자주 사용됩니다. 모델의 각 특성이 예측에 기여한 정도를 계산할 수 있어, 모델의 투명성을 높이고, 예측 과정에 대한 이해를 돕습니다.

#### 셰이플리 값 공식:

$$
\phi_i = \sum_{S \subseteq N \setminus \{i\}} \frac{|S|!(|N| - |S| - 1)!}{|N|!} [v(S \cup \{i\}) - v(S)]
$$

여기서:
- **N**: 모든 특성의 집합
- **S ⊆ N**: 특성의 부분 집합
- **v(S)**: 특성 집합 S가 기여한 모델의 예측값
- **ϕ_i**: 특성 i의 셰이플리 값, 즉 예측에 기여한 값

셰이플리 값은 모델의 각 특성(feature)이 결과에 미친 영향을 공정하게 분배하여 설명합니다. 이를 통해 머신러닝 모델의 설명 가능성을 높이고, 모델 해석에 기여합니다.

### 4. 응용 분야
- **경제 및 경매 이론**: 게임 이론은 경매 디자인에서 경쟁적 가격 설정 및 자원 할당 문제를 해결하는 데 중요한 도구입니다.
- **자율주행차**: 여러 자율주행차가 도로에서 안전하게 상호작용하며 운행할 때, 게임 이론이 각 차량의 의사결정 과정을 모델링하는 데 사용됩니다.
- **네트워크 보안**: 공격자와 방어자 간의 상호작용을 모델링할 때 게임 이론을 통해 최적의 방어 전략을 설계할 수 있습니다.