# STEP 41 행렬의 곱
## 41.1 벡터의 내적과 행렬의 곱
* 벡터의 내적
    * 두 벡터 사이의 대응 원소의 곱을 모두 합한 값
    * a = (a1,...,an), b = (b1,...,bn)
    * ![](../../images/식%2041.1.png)
* 행렬의 곱
    * ![](../../images/그림%2041-1.png)

In [1]:
import numpy as np

# 벡터의 내적
a = np.array([1,2,3])
b = np.array([4,5,6])
c = np.dot(a,b)
print(c)

# 행렬의 곱
a = np.array([[1,2], [3,4]])
b = np.array([[5,6], [7,8]])
c = np.dot(a, b)
print(c)

# a = np.array([1,2,3])
# b = np.array([4])
# c = np.dot(a,b)
# print(c)

32
[[19 22]
 [43 50]]


* np.dot(x, y) 함수
    * 두 인수가 모두 1차원 배열이면 벡터의 내적을 계산
    * 인수가 2차원 배열이면 행렬의 곱을 계산

## 41.2 행렬의 형상 체크
* 행렬과 벡터를 사용한 계산에서는 '형상'에 주의
    * ![](../../images/그림%2041-2.png)

## 41.3 행렬 곱의 역전파
* DeZero는 행렬 곱 계산을 MatMul 클래스와 matmul 함수로 구현
* ex> y = xW 행렬 곱의 역전파
    * 최종적으로 스칼라를 출력(L)한다고 가정
    * 계산그래프
        * ![](../../images/그림%2041-3.png)
    * x의 i번째 원소에 대한 미분
        * ![](../../images/식%2041.2.png)
    * ${\delta}L \over {\delta}x_i$ 은 $x_i$를 변화시켰을 때 L이 얼마나 변화하느냐를 뜻함
        * $x_i$의 변화로 y의 모든 원소가 변화하면 최종적으로 L이 변화
        * ${\delta}L \over {\delta}x_i$은 변화의 총합을 뜻함
        * ${\delta}y_j \over {\delta}x_i$ = $W_ij$
            * $y_j=x_1W_1j + x_2W_2j + ... + x_iW_ij + ... + x_HW_Hj$
        * ![](../../images/식%2041.3.png)
        * ${\delta}L \over {\delta}x_i$은 벡터 ${\delta}L \over {\delta}x$과 W의 i행 벡터의 내적으로 구해짐
        * ![](../../images/그림%2041-4.png)
* 행렬의 형상 체크
    * ex> y = xW
        * ![](../../images/그림%2041-5.png)
        * 형상 체크
            * ![](../../images/그림%2041-6.png)
* MatMul 클래스와 matmul 함수 구현
``` python
class MatMul(Function):
    def forward(self, x, W):
        y = x.dot(W) # np.dot(x, W) 대신 x.dot(W)로 구현
        return y
    def backward(self, gy):
        x, W = self.inputs
        gx = matmul(gy, W.T)
        gW = matmul(x.T, gy)
        return gx, gW
def matmul(x, W):
    return MatMul()(x, W)
```

In [2]:
from dezero import Variable
import dezero.functions as F

x = Variable(np.random.randn(2,3))
W = Variable(np.random.randn(3,4))
y = F.matmul(x, W)
y.backward()
print(x.grad.shape)
print(W.grad.shape)

(2, 3)
(3, 4)
