#파이썬을 보면 다양한 곱연산이 있고 곱연산의 종류 및 사용용도를 확인해 보고자 한다.
곱연산에는 교환법칙이 성립하는 것도 있지만 matrix의 곱연산은 교환법칙(commutative law)가 성립하지 않는다.

![image](https://user-images.githubusercontent.com/42470977/67067211-673b7a00-f1b0-11e9-9ca0-e254eeb7a323.jpg)

# 1. numpy * operator (* : asterisk) 
-> shape이 동일한 두 행렬을 원소끼리(element-wise) 곱하는 연산

In [36]:

import numpy as np
a = np.arange(6).reshape([2,3])  #0~5까지 숫자를 2*3행렬로 구성
b = np.arange(6).reshape([3,2]) - 2  #0~5까지 숫자를 -2하여 3*2행렬로 구성
print("<a행렬>\n", a,"\n<a.shape>\n", a.shape)
print("<b행렬>\n", b,"\n<b.shape>\n", b.shape)

<a행렬>
 [[0 1 2]
 [3 4 5]] 
<a.shape>
 (2, 3)
<b행렬>
 [[-2 -1]
 [ 0  1]
 [ 2  3]] 
<b.shape>
 (3, 2)


In [37]:
print(a*b)
print(b*a)

ValueError: operands could not be broadcast together with shapes (2,3) (3,2) 

# shape이 달라서 곱이 안됨

In [38]:
a*b.T

array([[ 0,  0,  4],
       [-3,  4, 15]])

In [39]:
b.T*a

array([[ 0,  0,  4],
       [-3,  4, 15]])

# a*b.T와 b.t*a 교환법칙이 성립

# 2. numpy.dot
-> 두 벡터의 내적곱 연산 *2차원행렬에서는 행렵곱으로도 사용가능하나, 행렬곱은 matmul을 사용합니다.
-> ***첫번째 행렬의 열크기(column)과 두번째 행렬의 행크기(row)가 같아야함.
   즉, 첫번째 행렬 맨뒤(dim 2)와 두번째 행렬 뒤에서 2번째(dim 1)가 같아야 함.
-> ex) 2*3, 3*4 OK, 2*3*4, 2*4*3 OK, 2*3*8, 2*4*3 NO

In [40]:
a = np.arange(24).reshape(2,3,4)
b = np.arange(24).reshape(2,4,3)

In [41]:
print(a ,"\n", a.shape)
print(b ,"\n", b.shape)

[[[ 0  1  2  3]
  [ 4  5  6  7]
  [ 8  9 10 11]]

 [[12 13 14 15]
  [16 17 18 19]
  [20 21 22 23]]] 
 (2, 3, 4)
[[[ 0  1  2]
  [ 3  4  5]
  [ 6  7  8]
  [ 9 10 11]]

 [[12 13 14]
  [15 16 17]
  [18 19 20]
  [21 22 23]]] 
 (2, 4, 3)


In [42]:
print(np.dot(a,b))    # =a.dot(b)
print(np.dot(a,b).shape)

[[[[  42   48   54]
   [ 114  120  126]]

  [[ 114  136  158]
   [ 378  400  422]]

  [[ 186  224  262]
   [ 642  680  718]]]


 [[[ 258  312  366]
   [ 906  960 1014]]

  [[ 330  400  470]
   [1170 1240 1310]]

  [[ 402  488  574]
   [1434 1520 1606]]]]
(2, 3, 2, 3)


In [43]:
print(np.dot(b,a))
print(np.dot(b,a).shape)

[[[[  20   23   26   29]
   [  56   59   62   65]]

  [[  56   68   80   92]
   [ 200  212  224  236]]

  [[  92  113  134  155]
   [ 344  365  386  407]]

  [[ 128  158  188  218]
   [ 488  518  548  578]]]


 [[[ 164  203  242  281]
   [ 632  671  710  749]]

  [[ 200  248  296  344]
   [ 776  824  872  920]]

  [[ 236  293  350  407]
   [ 920  977 1034 1091]]

  [[ 272  338  404  470]
   [1064 1130 1196 1262]]]]
(2, 4, 2, 4)


# np.dot(a,b)와 np.dot(b,a) 교환법칙이 성립 않음

# 3. numpy.matmul(@operator)
-> 행렬의 곱 연산  *3차원행렬 이상의 행렬곱을 계산하는 방식이 다름, 
   또한 *곱연산 같이 @로 대신할 수 있음

-> ***첫번째 행렬의 열크기(column)과 두번째 행렬의 행크기(row)가 같아야함.
   즉, 첫번째 행렬 맨뒤(dim 2)와 두번째 행렬 뒤에서 2번째(dim 1)가 같아야 함.
-> ex) 2*3, 3*4 OK, 2*3*4, 2*4*3 OK, 2*3*8, 2*4*3 NO

In [44]:
a = np.arange(24).reshape(2,3,4)
b = np.arange(24).reshape(2,4,3)

In [45]:
print(np.matmul(a,b))
print(np.matmul(a,b).shape)

[[[  42   48   54]
  [ 114  136  158]
  [ 186  224  262]]

 [[ 906  960 1014]
  [1170 1240 1310]
  [1434 1520 1606]]]
(2, 3, 3)


In [46]:
print(np.matmul(b,a))
print(np.matmul(b,a).shape)

[[[  20   23   26   29]
  [  56   68   80   92]
  [  92  113  134  155]
  [ 128  158  188  218]]

 [[ 632  671  710  749]
  [ 776  824  872  920]
  [ 920  977 1034 1091]
  [1064 1130 1196 1262]]]
(2, 4, 4)


In [47]:
a = np.arange(48).reshape(2,3,8)
b = np.arange(24).reshape(2,4,3)

In [48]:
print(np.matmul(a,b))
print(np.matmul(a,b).shape)

ValueError: matmul: Input operand 1 has a mismatch in its core dimension 0, with gufunc signature (n?,k),(k,m?)->(n?,m?) (size 4 is different from 8)

# dot과 matmul의 차이점
1. dot은 행렬과 상수 곱셈이 적용되지만 
   matmul은 행렬과 상수 곱셈이 적용되지 않는다.
2. 3차원 이상 행렬 곱셈일 때, dot과 matmul은 output 타입이다르다.
   ex)2*2*4, 2*4*2 일때,
      dot -> 2*2*2*2
      matmul -> 2*2*2
* matmul은 a*b*c일 때, b*c행렬이 a개수만큼 있다로 이해하면 된다.
 그리고 a*b*c*d일 때는 c*d행렬이 a*b개수만큼 있다로 이해??하면 된다.

# 4. tensorflow * operator
-> Numpy와 동일하게 원소끼리 곱셉(element-wise multiplication)을 수행
   동일한 차원끼리만 연산이 일어난다.
   ex)3*4, 3*4 OK, 3*4, 4*3 No -> 3*4, (4*3).T OK

In [49]:
import numpy as np
import tensorflow as tf

In [50]:
a = tf.constant(np.arange(6).reshape((2,3)))
b = tf.constant(np.arange(6).reshape((3,2)))

In [51]:
c = a * tf.transpose(b)
c

<tf.Tensor 'mul_8:0' shape=(2, 3) dtype=int32>

# 5. tensorflow.matmul
-> tensorflow에서 행렬곱을 할때는 tensorflow.matmul을 사용한다.
-> ***첫번째 행렬의 열크기(column)과 두번째 행렬의 행크기(row)가 같아야함. 즉, 첫번째 행렬 맨뒤(dim 2)와 두번째 행렬 뒤에서 2번째(dim 1)가 같아야 함. -> ex) 23, 34 OK, 234, 243 OK, 238, 24*3 NO

In [52]:
import numpy as np
import tensorflow as tf
import tensorflow.compat.v1 as tf  #tensorflow ver2 환경에서 tensorflow ver1환경이 돌아가게 해줌
tf.disable_v2_behavior()            #tensorflow ver2 환경에서 tensorflow ver1환경이 돌아가게 해줌

x = tf.placeholder(tf.float32, [None, 3])
w = tf.Variable(tf.random_normal([3,2], mean=0, stddev=0.1))
sess = tf.Session()
sess.run(tf.global_variables_initializer())

In [53]:
H1 = tf.matmul(w,x)    # 3*2, none*3  ==> 3*3  NG
H1

<tf.Tensor 'MatMul_7:0' shape=(3, 3) dtype=float32>

In [54]:
H2 = tf.matmul(x,w)    #none*3, 3*2 ==> none*2    OK
H2

<tf.Tensor 'MatMul_8:0' shape=(?, 2) dtype=float32>

# 6. tensorflow.multiply
-> *연산자와 동일한 결과 출력

In [55]:
import numpy as np
import tensorflow as tf

In [56]:
a = tf.constant(np.arange(6).reshape((2,3)))
b = tf.constant(np.arange(6).reshape((2,3))) -1

In [57]:
c = a * b
sess.run(c)

array([[ 0,  0,  2],
       [ 6, 12, 20]])

In [58]:
d = tf.multiply(a,b)
sess.run(d)

array([[ 0,  0,  2],
       [ 6, 12, 20]])