In [None]:
import numpy as np

## 1. แนวคิดสำคัญเริ่มต้น
---

> Matrix ไม่ใช่ตัวเลขตัวเดียว ดังนั้น "อนุพันธ์ของ Matrix" หมายถึงอนุพันธ์ของ **แต่ละองค์ประกอบ (element)**

ถ้า 
$$\mathbf{A}(x) = \begin{bmatrix} 
    a_{11}(x) & a_{12}(x)\\
    a_{21}(x) & a_{22}(x)
    \end{bmatrix}$$

แล้วนิยามอนุพันธ์คือ

$$\frac{d\mathbf{A}}{dx} = \begin{bmatrix} 
    \frac{d a_{11}}{dx}&\frac{d a_{12}}{dx}\\
    \frac{d a_{21}}{dx}&\frac{d a_{22}}{dx}
    \end{bmatrix}$$

## 2. อนุพันธ์ของ Matrix ที่ขึ้นกับตัวแปรเดียว
---

**example.**

ให้ 

$$\mathbf{A}(x) = \begin{bmatrix} x^2 & 3x \\ sin(x) & e^x \end{bmatrix}$$

หา $\frac{d\mathbf{A}}{dx}$


$$\frac{d\mathbf{A}}{dx} = \begin{bmatrix} 2x & 3 \\ cos(x) & e^x \end{bmatrix}$$

## 3. กฎพื้นฐานของอนุพันธ์ Matrix
---

### 3.1 บวก / ลบ matrix

ถ้า 
$$ \mathbf{C}(x) = \mathbf{A}(x) + \mathbf{B}(x)$$
แล้ว
$$ \frac{d \mathbf{C}}{dx} = \frac{d\mathbf{A}}{dx} + \frac{d\mathbf{B}}{dx}$$

เหมือน scalar derivative ทุกประการ

### 3.2 การคูณด้วยค่าคงที่

ถ้า $c$ เป็นค่าคงที่

$$ \frac {d}{dx} [c \mathbf{A}] = c \frac {d\mathbf{A}}{dx}$$

## 4. อนุพันธ์ของ Vector 
---

**column vector** 
ให้ 
$$ x(t) = \begin{bmatrix} t^2 \\ sin(t) \\ e^t \end{bmatrix}$$

อนุพันธ์คือ :

$$ \frac{dx}{dt} = \begin{bmatrix} 2t \\ cos(t) \\ e^t \end{bmatrix}$$

## 5. อนุพันธ์ของผลคูณ Matrix (Matrix Product Rule) 
---

**Rule**

ถ้า $\mathbf{A}(x)$ และ $\mathbf{B}(x)$ เป็น matrix

$$ \frac{d}{dx} [\mathbf{AB}] = \frac{d \mathbf{A}}{dx} \mathbf{B} + \mathbf{A} \frac {d \mathbf{B}}{dx}$$

**ลำดับการคูณห้ามสลับกัน**

### example

ให้
$$\mathbf{A}(x) = \begin{bmatrix} x & 0 \\ 0 & x \end{bmatrix},\ \ \mathbf{B}(x) = \begin{bmatrix} x \\ 1 \end{bmatrix}$$

ลองนำไปคูณก่อน

$$\mathbf{A} \cdot \mathbf{B} = \begin{bmatrix} x^2 \\ x \end{bmatrix}$$

$$ \frac{d}{dx} \begin{bmatrix} x^2 \\ x \end{bmatrix} = \begin{bmatrix} 2x \\ 1 \end{bmatrix}$$


ลองใช้กฎ product :

$$ \frac{d \mathbf{A}}{dx} = \begin{bmatrix} 1 & 0 \\ 0 & 1 \end{bmatrix}$$

$$ \frac{d \mathbf{B}}{dx} = \begin{bmatrix} 1 \\ 0 \end{bmatrix}$$

แทนค่า :

$$\begin{bmatrix} 1 & 0 \\ 0 & 1 \end{bmatrix} \begin{bmatrix} x \\ 1 \end{bmatrix} + \begin{bmatrix} x & 0 \\ 0 & x \end{bmatrix} \begin{bmatrix} 1 \\ 0 \end{bmatrix} = \begin{bmatrix} 2x \\ 1 \end{bmatrix}$$

## 6. อนุพันธ์ของ Scalar ที่ได้จาก Vector
---

#### 6.1 dot product

$$f(x) = \mathbf{x}^\intercal \cdot \mathbf{x}$$

ถ้า 
$$\mathbf{x}(x) = \begin{bmatrix} x_1(x) \\ x_2(x) \end{bmatrix}$$
จะได้
$$ f = x_1^2 + x_2^2$$

อนุพันธ์: 
$$ \frac{df}{dx} = 2x_1 \frac{dx_1}{dx} + 2x_2\frac{dx_2}{dx}$$

https://towardsdatascience.com/matrix-calculus-for-data-scientists-6f0990b9c222/

### Scalar by vector derivative

the derivative of a scalar valued function with respect to a vector of variables then is a row vector. This row vector has one column for each variable we want to differentiate by.

$$\frac {\partial f}{\partial \mathbf{x}} = \begin{bmatrix} \frac{\partial f(x_1, x_2, ...}{\partial x_1} & \frac{\partial f(x_1, x_2, ...}{\partial x_2} & \frac{\partial f(x_1, x_2, ...}{\partial x_3}  & ...\end{bmatrix}$$

The dots just indicate, that there there are not necessarily  3 variables we want to differentiate by, but rather a variable number.

Let's make an example:
$$f(x_1, x_2, x_3) = x_1 + x_2 + x_3$$
if 
$$\mathbf{x} = \begin{bmatrix} x_1 & x_2 & x_3 \end{bmatrix}$$

then we got

$$\frac {\partial f} {\partial \mathbf {x}} = \begin{bmatrix} 1 & 1 & 1 \end{bmatrix}$$

### Vector by scalar derivative

If we have a function $f$, which outputs a vecor and want to take the derivative of it with respect to a single variable, we get a column vector as result.

$$\frac {\partial \mathbf{f}}{\partial x} = \begin{bmatrix} \frac{\partial f_1(x)}{\partial x} \\ \frac {\partial f_2(x)} {\partial x} \\ ... \end{bmatrix}$$