## NumPy 배열 다루기
- Transpose
- Reshape & Flatten
- New axis
- Concatenate

In [1]:
import numpy as np

### Transpose
배열의 행과 열을 바꾸는 연산이다.

In [4]:
origin_array = np.array([[1, 2, 3], [4, 5, 6]])
origin_array

array([[1, 2, 3],
       [4, 5, 6]])

In [5]:
transpose_array = origin_array.T
transpose_array

array([[1, 4],
       [2, 5],
       [3, 6]])

### Reshape & Flatten
기존의 배열을 내부 데이터는 보존한 채로 배열의 형태만 바꾸는 연산이다.

In [6]:
origin_array = np.arange(12)
origin_array

array([ 0,  1,  2,  3,  4,  5,  6,  7,  8,  9, 10, 11])

In [7]:
reshape_array = origin_array.reshape(3, 4)
reshape_array

array([[ 0,  1,  2,  3],
       [ 4,  5,  6,  7],
       [ 8,  9, 10, 11]])

In [8]:
reshape_array2 = origin_array.reshape(2, 2, -1)
reshape_array2

array([[[ 0,  1,  2],
        [ 3,  4,  5]],

       [[ 6,  7,  8],
        [ 9, 10, 11]]])

In [10]:
flatten_array = reshape_array2.flatten()
flatten_array

array([ 0,  1,  2,  3,  4,  5,  6,  7,  8,  9, 10, 11])

### New axis
배열의 차원을 늘리는데 주로 사용한다. reshape 메소드를 사용하거나 np.newaxis를 이용하여 배열의 차원을 변경할 수 있다.

In [11]:
origin_array = np.arange(5)
origin_array

array([0, 1, 2, 3, 4])

In [18]:
origin_array.reshape(-1, 1)

array([[0],
       [1],
       [2],
       [3],
       [4]])

In [19]:
newaxis_array = origin_array[:, np.newaxis]
newaxis_array

array([[0],
       [1],
       [2],
       [3],
       [4]])

In [20]:
newaxis_array2 = origin_array[:, np.newaxis, np.newaxis]
newaxis_array2

array([[[0]],

       [[1]],

       [[2]],

       [[3]],

       [[4]]])

### Concatenate
배열의 행 또는 열의 수가 같은 두 개 이상의 배열을 연결하여 더 큰 배열을 만드는 연산이다.

#### np.hstack
- row의 수가 같은 배열들을 col 기준으로 연결하여 col의 수가 더 많은 배열을 리턴한다.

In [22]:
hstack_array1 = np.ones((2, 3))
hstack_array1

array([[ 1.,  1.,  1.],
       [ 1.,  1.,  1.]])

In [23]:
hstack_array2 = np.zeros((2, 2))
hstack_array2

array([[ 0.,  0.],
       [ 0.,  0.]])

In [24]:
np.hstack([hstack_array1, hstack_array2])

array([[ 1.,  1.,  1.,  0.,  0.],
       [ 1.,  1.,  1.,  0.,  0.]])

#### np.vstack
- col의 수가 같은 배열들을 row 기준으로 연결하여 row의 수가 더 많은 배열을 리턴한다.

In [27]:
vstack_array1 = np.ones((3, 2))
vstack_array1

array([[ 1.,  1.],
       [ 1.,  1.],
       [ 1.,  1.]])

In [29]:
vstack_array2 = np.zeros((4, 2))
vstack_array2

array([[ 0.,  0.],
       [ 0.,  0.],
       [ 0.,  0.],
       [ 0.,  0.]])

In [30]:
np.vstack([vstack_array1, vstack_array2])

array([[ 1.,  1.],
       [ 1.,  1.],
       [ 1.,  1.],
       [ 0.,  0.],
       [ 0.,  0.],
       [ 0.,  0.],
       [ 0.,  0.]])

#### np.dstack
- row 또는 col이 아닌 depth 기준으로 배열을 합친다. 때문에 가장 안쪽 원소의 차원이 증가한다.
- 즉, 가장 내부의 원소가 배열이 된다.

In [31]:
dstack_array1 = np.ones((3, 4))
dstack_array1

array([[ 1.,  1.,  1.,  1.],
       [ 1.,  1.,  1.,  1.],
       [ 1.,  1.,  1.,  1.]])

In [32]:
dstack_array2 = np.zeros((3, 4))
dstack_array2

array([[ 0.,  0.,  0.,  0.],
       [ 0.,  0.,  0.,  0.],
       [ 0.,  0.,  0.,  0.]])

In [33]:
np.dstack([dstack_array1, dstack_array2])

array([[[ 1.,  0.],
        [ 1.,  0.],
        [ 1.,  0.],
        [ 1.,  0.]],

       [[ 1.,  0.],
        [ 1.,  0.],
        [ 1.,  0.],
        [ 1.,  0.]],

       [[ 1.,  0.],
        [ 1.,  0.],
        [ 1.,  0.],
        [ 1.,  0.]]])

In [34]:
np.dstack([dstack_array1, dstack_array2]).shape

(3, 4, 2)

#### np.stack
- 지정한 차원(축)으로 배열을 연결한다. axis=0 으로 디폴트 설정이 되어 있다.

In [35]:
stack_array1 = np.ones((3, 4))
stack_array1

array([[ 1.,  1.,  1.,  1.],
       [ 1.,  1.,  1.,  1.],
       [ 1.,  1.,  1.,  1.]])

In [37]:
stack_array2 = np.zeros((3, 4))
stack_array2

array([[ 0.,  0.,  0.,  0.],
       [ 0.,  0.,  0.,  0.],
       [ 0.,  0.,  0.,  0.]])

In [38]:
np.stack([stack_array1, stack_array2])

array([[[ 1.,  1.,  1.,  1.],
        [ 1.,  1.,  1.,  1.],
        [ 1.,  1.,  1.,  1.]],

       [[ 0.,  0.,  0.,  0.],
        [ 0.,  0.,  0.,  0.],
        [ 0.,  0.,  0.,  0.]]])

In [39]:
np.stack([stack_array1, stack_array2], axis=1)

array([[[ 1.,  1.,  1.,  1.],
        [ 0.,  0.,  0.,  0.]],

       [[ 1.,  1.,  1.,  1.],
        [ 0.,  0.,  0.,  0.]],

       [[ 1.,  1.,  1.,  1.],
        [ 0.,  0.,  0.,  0.]]])

In [40]:
np.stack([stack_array1, stack_array2], axis=2)

array([[[ 1.,  0.],
        [ 1.,  0.],
        [ 1.,  0.],
        [ 1.,  0.]],

       [[ 1.,  0.],
        [ 1.,  0.],
        [ 1.,  0.],
        [ 1.,  0.]],

       [[ 1.,  0.],
        [ 1.,  0.],
        [ 1.,  0.],
        [ 1.,  0.]]])

아래처럼 기존 배열의 차원을 넘어가는 축을 기준으로 삼으면 에러가 발생한다.

In [42]:
np.stack([stack_array1, stack_array2], axis=3)

IndexError: axis 3 out of bounds [-3, 3)