## 행렬의 미분
- 행렬을 입력이나 출력으로 가지는 함수를 미분하는 것
- 분자중심 표현법(Numerator-layout notation)
- 분모중심 표현법(Denominator-layout notation)

### 스칼라를 벡터로 미분하는 경우
- 결과를 열벡터로 표시
- 그레디언트 벡터(gradient vector) 
    - $\nabla f$로 표기


$
\nabla f = 
\frac{\partial f}{\partial {x}} =
\begin{bmatrix}
\dfrac{\partial f}{\partial x_1}\\
\vdots\\
\dfrac{\partial f}{\partial x_N}\\
\end{bmatrix}
$

### 벡터를 표시하는 방법
- 2개의 입력변수를 가지는 2차원 함수
    - 컨투어(Contour)플롯
        - $f(x, y)$를 평면상에서 나타낸다.
        - 입력 변수 $x, y$ 위치에서의 그레디언트 벡터 $\frac{\partial f}{\partial x}, \frac{\partial f}{\partial y}$는 그 위치를 원점으로 하는 화살표로 표현가능
        - 그레디언트 벡터 방향은 $\frac{\partial f}{\partial x}$와 $\frac{\partial f}{\partial y}$의 부호에 의해 결정
    - 퀴버(Quiver)플롯
        - 컨투어 플롯 위에 그레디언트 벡터를 화살표로 나타낸 플롯
        - 화살표는 화살표 시작 지점의 그레디언트 벡터를 나타냄

### 퀴버(Quiver)플롯 특징
- 그레디언트 벡터의 크기는 기울기를 의미
- 그레디언트 벡터의 방향은 단위 길이당 함수값(높이)이 가장 크게 증가하는 방향을 가리킴.
- 그레디언트 벡터의 방향은 등고선(isoline)의 방향과 직교.

### 행렬미분법칙

#### 1. 선형 모형
- 선형 모형을 미분하면 그레디언트 벡터는 가중치 벡터이다.

    $ 
    f(x) = w^T x\
    \rightarrow\
    \nabla f = {w} 
    $ 

#### 2. 이차 형식
- 이차 형식을 미분하면 행렬과 벡터의 곱으로 나타난다.

    $
    f(x) = x^T A x\
    \rightarrow\
    \nabla f(x) = ({A} + {A}^{T}){x}
    $

#### 3. 행렬과 벡터의 곱의 미분
- 행렬 $A$와 벡터 $x$의 곱 $Ax$를 벡터 $x$로 미분하면 행렬 $A^T$가 된다.

    $
    f(x) = Ax\
    \rightarrow\
    \nabla f(x) = A^T 
    $

#### 4. 행렬 곱의 대각성분

- 두 정방행렬을 곱해서 만들어진 행렬의 대각성분(trace)는 스칼라이다. 
- 이 스칼라를 뒤의 행렬로 미분하면 앞의 행렬의 전치행렬이 나온다.

    $
    f(X) = \text{tr} ({A}{X})\
    \rightarrow\
    \dfrac{\partial f}{\partial X} = {A}^T
    $

#### 5. 행렬식의 로그
- 행렬식(determinant)은 스칼라값이고 이 값의 로그 값도 스칼라이다.
- 이 값을 원래의 행렬로 미분하면 원래 행렬의 역행렬의 전치 행렬이 된다.

    $
    f(X) = \log | {A} |\
    \rightarrow\
    \dfrac{\partial f}{\partial A} = ({A}^{-1})^T 
    $