# Numpy 공부 4단계
> Numpy array를 결합하는 기능들에 대해 알아보자. (`np.concatenate`, `np.concat`)

## np.concatenate

`-` 기본예제

In [3]:
import numpy as np

In [5]:
a = np.array([1,2])
b = -a

In [6]:
np.concatenate([a,b])

array([ 1,  2, -1, -2])

`-` 응용

In [8]:
a = np.array([1,2])
b = -a
c = np.array([3,4,5])

In [9]:
np.concatenate([a,b,c])

array([ 1,  2, -1, -2,  3,  4,  5])

- 여기까진 딱히 concatenate의 메리트가 없어보임
- 리스트였다면 a+b+c하면 되는 기능이니까?

`-` 2d array에 적용해보자.

In [12]:
a = np.arange(4).reshape(2,2)
b = -a

In [15]:
a

array([[0, 1],
       [2, 3]])

In [16]:
b

array([[ 0, -1],
       [-2, -3]])

In [13]:
np.concatenate([a,b])

array([[ 0,  1],
       [ 2,  3],
       [ 0, -1],
       [-2, -3]])

- 위아래로 붙었네! 그럼 옆으로 붙이려면 어떻게 하지?

`-` 옆으로 붙이려면?

In [14]:
np.concatenate([a,b], axis=1)

array([[ 0,  1,  0, -1],
       [ 2,  3, -2, -3]])

`-` 위의 코드에서 axis=1 이 뭐지? axis=0,2 등을 치면 결과가 어떻게 될까?

In [17]:
np.concatenate([a,b],axis=0)

array([[ 0,  1],
       [ 2,  3],
       [ 0, -1],
       [-2, -3]])

- 이건 그냥 np.concatenate([a,b])와 같다.
- np.concatenate([a,b])는 np.concatenate([a,b],axis=0)의 생략버전이군?

In [18]:
np.concatenate([a,b],axis=2)

AxisError: axis 2 is out of bounds for array of dimension 2

- 이런건 없다.

`-` axis의 의미가 뭔지 궁금함. 좀 더 예제를 살펴보자.

In [19]:
a = np.array(range(2*3*4)).reshape(2,3,4) # 3d array
a

array([[[ 0,  1,  2,  3],
        [ 4,  5,  6,  7],
        [ 8,  9, 10, 11]],

       [[12, 13, 14, 15],
        [16, 17, 18, 19],
        [20, 21, 22, 23]]])

In [21]:
b = -a
b

array([[[  0,  -1,  -2,  -3],
        [ -4,  -5,  -6,  -7],
        [ -8,  -9, -10, -11]],

       [[-12, -13, -14, -15],
        [-16, -17, -18, -19],
        [-20, -21, -22, -23]]])

In [22]:
np.concatenate([a,b],axis=0)

array([[[  0,   1,   2,   3],
        [  4,   5,   6,   7],
        [  8,   9,  10,  11]],

       [[ 12,  13,  14,  15],
        [ 16,  17,  18,  19],
        [ 20,  21,  22,  23]],

       [[  0,  -1,  -2,  -3],
        [ -4,  -5,  -6,  -7],
        [ -8,  -9, -10, -11]],

       [[-12, -13, -14, -15],
        [-16, -17, -18, -19],
        [-20, -21, -22, -23]]])

In [23]:
np.concatenate([a,b],axis=1)

array([[[  0,   1,   2,   3],
        [  4,   5,   6,   7],
        [  8,   9,  10,  11],
        [  0,  -1,  -2,  -3],
        [ -4,  -5,  -6,  -7],
        [ -8,  -9, -10, -11]],

       [[ 12,  13,  14,  15],
        [ 16,  17,  18,  19],
        [ 20,  21,  22,  23],
        [-12, -13, -14, -15],
        [-16, -17, -18, -19],
        [-20, -21, -22, -23]]])

In [24]:
np.concatenate([a,b], axis=2)

array([[[  0,   1,   2,   3,   0,  -1,  -2,  -3],
        [  4,   5,   6,   7,  -4,  -5,  -6,  -7],
        [  8,   9,  10,  11,  -8,  -9, -10, -11]],

       [[ 12,  13,  14,  15, -12, -13, -14, -15],
        [ 16,  17,  18,  19, -16, -17, -18, -19],
        [ 20,  21,  22,  23, -20, -21, -22, -23]]])

- 이번에는 axis=2까지 된다?

In [25]:
np.concatenate([a,b], axis=3)

AxisError: axis 3 is out of bounds for array of dimension 3

- axis=3까지는 안된다?

`-` 뭔가 나름의 방식으로 합쳐지는데 원리가 뭘까?

(분석1) np.concatenate([a,b], axis=0)

In [26]:
# a = np.array(range(2*3*4)).reshape(2,3,4)
a = np.arange(2*3*4).reshape(2,3,4)
b = -a

In [29]:
a.shape, b.shape, np.concatenate([a,b], axis=0).shape

((2, 3, 4), (2, 3, 4), (4, 3, 4))

- 첫번째 차원이 바뀌었다. $\Rightarrow$ 첫번째 축이 바뀌었다. $\Rightarrow$ axis=0 (파이썬은 0부터 시작하니까!)

(분석2) np.concatenate([a,b], axis=1)

In [26]:
# a = np.array(range(2*3*4)).reshape(2,3,4)
a = np.arange(2*3*4).reshape(2,3,4)
b = -a

In [30]:
a.shape, b.shape, np.concatenate([a,b], axis=1).shape

((2, 3, 4), (2, 3, 4), (2, 6, 4))

- 두번째 차원이 바뀌었다. $\Rightarrow$ 두번째 축이 바뀌었다. $\Rightarrow$ axis=1

(분석3) np.concatenate([a,b], axis=2)

In [26]:
# a = np.array(range(2*3*4)).reshape(2,3,4)
a = np.arange(2*3*4).reshape(2,3,4)
b = -a

In [31]:
a.shape, b.shape, np.concatenate([a,b], axis=2).shape

((2, 3, 4), (2, 3, 4), (2, 3, 8))

- 세번째 차원이 바뀌었다. $\Rightarrow$ 세번째 축이 바뀌었다. $\Rightarrow$ axis=2

(분석4) np.concatenate([a,b], axis=3)

In [32]:
# a = np.array(range(2*3*4)).reshape(2,3,4)
a = np.arange(2*3*4).reshape(2,3,4)
b = -a

In [33]:
a.shape, b.shape, np.concatenate([a,b], axis=3).shape

AxisError: axis 3 is out of bounds for array of dimension 3

- 네번째 차원이 없다. $\Rightarrow$ 세번째 축이 없다. $\Rightarrow$ axis=3으로 하면 에러가 난다.

(보너스)

In [32]:
# a = np.array(range(2*3*4)).reshape(2,3,4)
a = np.arange(2*3*4).reshape(2,3,4)
b = -a

In [35]:
np.concatenate([a,b], axis=-1)

array([[[  0,   1,   2,   3,   0,  -1,  -2,  -3],
        [  4,   5,   6,   7,  -4,  -5,  -6,  -7],
        [  8,   9,  10,  11,  -8,  -9, -10, -11]],

       [[ 12,  13,  14,  15, -12, -13, -14, -15],
        [ 16,  17,  18,  19, -16, -17, -18, -19],
        [ 20,  21,  22,  23, -20, -21, -22, -23]]])

In [34]:
a.shape, b.shape, np.concatenate([a,b], axis=-1).shape

((2, 3, 4), (2, 3, 4), (2, 3, 8))

- 마지막 차원이 바뀌었다. $\Rightarrow$ 마지막 축이 바뀌었다. $\Rightarrow$ axis=-1

(보너스2)

In [32]:
# a = np.array(range(2*3*4)).reshape(2,3,4)
a = np.arange(2*3*4).reshape(2,3,4)
b = -a

In [37]:
np.concatenate([a,b], axis=-2)

array([[[  0,   1,   2,   3],
        [  4,   5,   6,   7],
        [  8,   9,  10,  11],
        [  0,  -1,  -2,  -3],
        [ -4,  -5,  -6,  -7],
        [ -8,  -9, -10, -11]],

       [[ 12,  13,  14,  15],
        [ 16,  17,  18,  19],
        [ 20,  21,  22,  23],
        [-12, -13, -14, -15],
        [-16, -17, -18, -19],
        [-20, -21, -22, -23]]])

In [38]:
a.shape, b.shape, np.concatenate([a,b], axis=-2).shape

((2, 3, 4), (2, 3, 4), (2, 6, 4))

- 마지막에서 2번째 차원이 바뀌었다. $\Rightarrow$ 마지막에서 2번째 축이 바뀌었다. $\Rightarrow$ axis=-2

(보너스3)

In [39]:
# a = np.array(range(2*3*4)).reshape(2,3,4)
a = np.arange(2*3*4).reshape(2,3,4)
b = -a

In [40]:
np.concatenate([a,b], axis=-3)

array([[[  0,   1,   2,   3],
        [  4,   5,   6,   7],
        [  8,   9,  10,  11]],

       [[ 12,  13,  14,  15],
        [ 16,  17,  18,  19],
        [ 20,  21,  22,  23]],

       [[  0,  -1,  -2,  -3],
        [ -4,  -5,  -6,  -7],
        [ -8,  -9, -10, -11]],

       [[-12, -13, -14, -15],
        [-16, -17, -18, -19],
        [-20, -21, -22, -23]]])

In [41]:
a.shape, b.shape, np.concatenate([a,b], axis=-3).shape

((2, 3, 4), (2, 3, 4), (4, 3, 4))

- 마지막에서 3번째 차원이 바뀌었다. $\Rightarrow$ 마지막에서 3번째 축이 바뀌었다. $\Rightarrow$ axis=-3

(보너스4)

In [42]:
# a = np.array(range(2*3*4)).reshape(2,3,4)
a = np.arange(2*3*4).reshape(2,3,4)
b = -a

In [43]:
np.concatenate([a,b], axis=-4)

AxisError: axis -4 is out of bounds for array of dimension 3

In [44]:
a.shape, b.shape, np.concatenate([a,b], axis=-4).shape

AxisError: axis -4 is out of bounds for array of dimension 3

- 마지막에서 4번째 차원은 없다. $\Rightarrow$ 마지막에서 4번째 축은 없다. $\Rightarrow$ axis=-4는 에러가 난다.

`-` 0차원은 축이 없으므로 `concatenate`를 쓸 수 없다.

In [45]:
a = np.array(1)
b = np.array(-1)

In [46]:
a.shape, b.shape

((), ())

In [47]:
np.concatenate([a,b])

ValueError: zero-dimensional arrays cannot be concatenated

이게 만약에 이렇게 바뀌면 1차원이니까 쓸 수 있다.

In [48]:
a = np.array([1])
b = np.array([-1])
a.shape, b.shape

((1,), (1,))

In [49]:
np.concatenate([a,b])

array([ 1, -1])

`-`  꼭 a,b가 같은 차원일 필요는 없다.

In [51]:
a = np.array(range(4)).reshape(2,2)
b = np.array(range(2)).reshape(2,1)

In [53]:
np.concatenate([a,b], axis=1)

array([[0, 1, 0],
       [2, 3, 1]])

In [56]:
a.shape, b.shape, np.concatenate([a,b], axis=1).shape

((2, 2), (2, 1), (2, 3))

## np.stack

`-` 혹시 아래가 가능할까?

- $(3,)$ 결합 : $(3,) \Rightarrow (3,2)$

In [57]:
a = np.array([1,2,3])
b = -a

In [58]:
a,b

(array([1, 2, 3]), array([-1, -2, -3]))

In [61]:
a.shape, b.shape

((3,), (3,))

In [60]:
np.concatenate([a,b], axis=1)

AxisError: axis 1 is out of bounds for array of dimension 1

- 불가능

`-` 아래와 같이 하면 해결 가능

In [67]:
a = np.array([1,2,3]).reshape(3,1)
b = -a

In [68]:
a.shape, b.shape

((3, 1), (3, 1))

In [69]:
a,b

(array([[1],
        [2],
        [3]]),
 array([[-1],
        [-2],
        [-3]]))

In [70]:
np.concatenate([a,b], axis=1)

array([[ 1, -1],
       [ 2, -2],
       [ 3, -3]])

- 분석: $(3) (3) \Rightarrow (3,1),(3,1)\Rightarrow (3,1) \space \tt{concat} \space (3,1)$

`-` 위의 과정을 줄여서 아래와 같이 할 수 있다.

In [72]:
a = np.array([1,2,3])
b = -a

In [73]:
np.stack([a,b], axis=1)

array([[ 1, -1],
       [ 2, -2],
       [ 3, -3]])

`-` 아래도 가능

In [74]:
np.stack([a,b],axis=0)

array([[ 1,  2,  3],
       [-1, -2, -3]])

`-` 분석해보고 외우자

(분석1)

In [75]:
a = np.array([1,2,3])
b = -a

In [76]:
a.shape, b.shape, np.stack([a,b],axis=0).shape

((3,), (3,), (2, 3))

- $(3)(3) \Rightarrow \text{첫 위치에 축을 추가 (axis=0)} \Rightarrow (1,3)(1,3) \Rightarrow (2,3)$

(분석2)

In [77]:
a = np.array([1,2,3])
b = -a

In [78]:
a.shape, b.shape, np.stack([a,b],axis=1).shape

((3,), (3,), (3, 2))

$(3)(3)\Rightarrow \text{두번째 위치에 축을 추가 (axis=1)} \Rightarrow (3,1)(3,1) \Rightarrow (3,2)$

`-` 고차원예제

In [79]:
a = np.arange(3*4*5).reshape(3,4,5)
b = -a

In [80]:
a.shape, b.shape

((3, 4, 5), (3, 4, 5))

In [81]:
np.stack([a,b], axis=0).shape # (3,4,5) => (1,3,4,5) // 첫 위치에 축이 추가되고 스택

(2, 3, 4, 5)

In [82]:
np.stack([a,b], axis=1).shape # (3,4,5) => (3,1,4,5) // 두번째 위치에 축이 추가되고 스택

(3, 2, 4, 5)

In [83]:
np.stack([a,b], axis=2).shape # (3,4,5) => (3,4,1,5) // 세번째 위치에 축이 추가되고 스택

(3, 4, 2, 5)

In [84]:
np.stack([a,b], axis=3).shape # (3,4,5) => (3,4,5,1) // 네번째 위치에 축이 추가되고 스택

(3, 4, 5, 2)

In [86]:
np.stack([a,b], axis=-1).shape # axis=-1 <=> axis=3

(3, 4, 5, 2)

In [87]:
np.stack([a,b], axis=-2).shape # axis=-2 <=> axis=2

(3, 4, 2, 5)

***np.concatenate*** 는 축의 총 개수를 유지하면서 결합, ***np.stack***은 축의 개수를 하나 증가시키면서 결합