### numpy - pad

- https://docs.scipy.org/doc/numpy-1.12.0/reference/generated/numpy.pad.html
- CNN에서 padding할 때 사용

- Parameters
 - array: padding할 array
 - pad_width: 각 axis마다 (좌측에 몇개, 우측에 몇개) padding할지를 지정한다. 
 - mode: 'constant' 만 써봄. 

- axis 순서는 가장 바깥쪽부터 list에 element를 append하는 것 처럼 순차적으로 padding 한다.

In [22]:
ts2 = np.array([1, 1, 1])
ts2

array([1, 1, 1])

In [23]:
np.pad(ts2, (2, 3), 'constant', constant_values=(2, 3))

array([2, 2, 1, 1, 1, 3, 3, 3])

> 아래 코드에서는 0번째 axis의 좌측에 6을 1개 우측에 7을 2개, 1번째 axis의 좌측에 8을 4개 우측에 9를 5개 padding 하고 있다.

In [20]:
ts1 = np.array([[1, 1, 1, 1], [2, 2, 2, 2]]); ts1

array([[1, 1, 1, 1],
       [2, 2, 2, 2]])

In [21]:
np.pad(ts1, ((1, 2), (4,5)), 'constant', constant_values = ((6, 7), (8, 9)))

array([[8, 8, 8, 8, 6, 6, 6, 6, 9, 9, 9, 9, 9],
       [8, 8, 8, 8, 1, 1, 1, 1, 9, 9, 9, 9, 9],
       [8, 8, 8, 8, 2, 2, 2, 2, 9, 9, 9, 9, 9],
       [8, 8, 8, 8, 7, 7, 7, 7, 9, 9, 9, 9, 9],
       [8, 8, 8, 8, 7, 7, 7, 7, 9, 9, 9, 9, 9]])

### numpy -  Matrix multiplication and product with other
- multiplication과 product는 다르다.
- multiplication은 곱셈연산자나 np.multiply를 사용해야한다.
- product는 np.dot을 사용한다.

In [44]:
X = np.array([[1, 1, 1], [2, 2, 2]])  # (2, 3)
Y = np.array([[0.1, 0.1, 0.1], [0.01, 0.01, 0.01]])  # (2, 3)
Z = np.array([[0.1, 0.1], [0.2, 0.2], [0.3, 0.3]])  # (3, 2)
print('X.shape:{}, Y.shape:{}, Z.shape:{}'.format(X.shape, Y.shape, Z.shape))

X.shape:(2, 3), Y.shape:(2, 3), Z.shape:(3, 2)


In [45]:
X*Y

array([[ 0.1 ,  0.1 ,  0.1 ],
       [ 0.02,  0.02,  0.02]])

In [46]:
np.multiply(X, Y)

array([[ 0.1 ,  0.1 ,  0.1 ],
       [ 0.02,  0.02,  0.02]])

In [47]:
# error because of shape miss match
np.multiply(X, Z)

ValueError: operands could not be broadcast together with shapes (2,3) (3,2) 

In [48]:
np.dot(X, Z)

array([[ 0.6,  0.6],
       [ 1.2,  1.2]])

In [49]:
# error because of shape miss match
np.dot(X, Y)

ValueError: shapes (2,3) and (2,3) not aligned: 3 (dim 1) != 2 (dim 0)

### numpy - Matrix sum itself

In [50]:
X = np.array([[1, 1, 1], [2, 2, 2]])  # (2, 3)

In [56]:
s1 = np.sum(X, axis=0, keepdims=True)  # (1, 3)
print(s1, s1.shape)

[[3 3 3]] (1, 3)


In [58]:
s2 = np.sum(X, axis=0, keepdims=False)  # (3, )
print(s2, s2.shape)

[3 3 3] (3,)


In [65]:
# if don't specify axis, then will sum all of the elements
np.sum(X)

9

### numpy - Matrix sum with other

In [61]:
X = np.array([[1, 1, 1], [2, 2, 2]])  # (2, 3)
Y = np.array([[0.1, 0.1, 0.1], [0.01, 0.01, 0.01]])  # (2, 3)
K = np.array([1])

In [62]:
X + Y

array([[ 1.1 ,  1.1 ,  1.1 ],
       [ 2.01,  2.01,  2.01]])

In [63]:
X + K

array([[2, 2, 2],
       [3, 3, 3]])

### numpy - zeros
- https://docs.scipy.org/doc/numpy-1.13.0/reference/generated/numpy.zeros.html

- Parameters
 - shape : 결과의 shape
 - dtype : 결과 element의 data-type
 - order : ?

In [2]:
np.zeros(5)

array([ 0.,  0.,  0.,  0.,  0.])

In [3]:
np.zeros((2, 3))

array([[ 0.,  0.,  0.],
       [ 0.,  0.,  0.]])

.

### numpy - max, mean

In [22]:
X = np.ones((2, 3, 4)); X.shape

(2, 3, 4)

In [29]:
Y = np.max(X, axis=(1, 2)); Y

array([ 1.,  1.])

In [30]:
Y.shape

(2,)

### nd array reshape

요약하면...    

- 아래와 같은 변수 생성을 지양
```Python
a = np.random.randn(5)
```

- 열벡터를 생성할 때에는 아래와 같은 방식을 사용
```Python
a = np.random.randn(5, 1)
```

- 행벡터를 생성할 때에는 아래와 같은 방식을 사용
```Python
a = np.random.randn(1, 5)
```

- 혹은 변수 생성후 shape 변경(reshape은 CPU 비용이 저렴함)
```Python
a = np.random.randn(5).reshape((1, 5))
```

- assertion을 삽입하여 에러를 감지
```Python
assert(a.shape == (5,1))
```

> - reshape(1, -1) 은 행렬을 행-벡터로 변환
> - reshape(-1, 1) 은 행렬을 열-벡터로 변환
> - ravel()은 행렬을 rank1 배열로 변환

###### rank1 array로 변환하는 다른 방법은 해당 dimensition의 shape을 0으로 지정하는 것이다.

In [17]:
import numpy as np

a = np.random.randn(5, 1)

In [18]:
a.shape

(5, 1)

In [19]:
b = a[:, 0]
b

array([ 1.58662643,  1.0121656 , -0.62154303, -0.02604057, -0.16028451])

In [20]:
b.shape

(5,)

###### numpy.tile(A, reps)
- A를 reps만큼 각 dimension별로 복제한다.
 - A와 reps의 dimension을 큰 쪽으로 맞추는데, 한쪽이 적을 경우 앞에 1을 padding한다. 예를들어 A가 1차원이고 shape이 (3,)일때 reps가 (4, 5)로서 2차원이라면 A는 (1, 3)으로 차원 확장된 후 reps만큼 복제되어 결과의 shape은 (4, 15)가 된다. 또한 만약 reps가 ( 4, 1, 7)로서 3차원이라면 A는 (1, 1, 3)으로 차원확장된 후 reps만큼 복제되어 결과의 shape은 (4, 1, 21)이 된다.
 - 예를들어 A가 4차원이고 shape이 (2, 3, 4, 5)일때 reps가 (2, 2)라면 reps가 (1, 1, 2, 2)로 확장된 후  결과의 shape은 (2, 3, 8, 10)이 된다.

In [21]:
a = np.array([1, 2, 3])
print(a, a.shape)

[1 2 3] (3,)


In [23]:
b = np.tile(a, reps=(4, 5))
print(b, b.shape)

[[1 2 3 1 2 3 1 2 3 1 2 3 1 2 3]
 [1 2 3 1 2 3 1 2 3 1 2 3 1 2 3]
 [1 2 3 1 2 3 1 2 3 1 2 3 1 2 3]
 [1 2 3 1 2 3 1 2 3 1 2 3 1 2 3]] (4, 15)


In [24]:
c = np.tile(a, reps=(4, 1, 7))
print(c, c.shape)

[[[1 2 3 1 2 3 1 2 3 1 2 3 1 2 3 1 2 3 1 2 3]]

 [[1 2 3 1 2 3 1 2 3 1 2 3 1 2 3 1 2 3 1 2 3]]

 [[1 2 3 1 2 3 1 2 3 1 2 3 1 2 3 1 2 3 1 2 3]]

 [[1 2 3 1 2 3 1 2 3 1 2 3 1 2 3 1 2 3 1 2 3]]] (4, 1, 21)


In [27]:
i = np.zeros((2, 3, 4, 5))
print(i.shape)

(2, 3, 4, 5)


In [28]:
j = np.tile(i, reps=(2, 2))
print(j.shape)

(2, 3, 8, 10)
