# 배열의 형태(shape) 변경

## reshape()을 이용한 차원 변경
- `numpy.reshape(a, newshape)` 또는 `ndarray.reshape(newshape)`
    - a: 형태를 변경할 배열
    - newshape : 변경할 형태 설정. 
        - 원소의 개수를 유지하는 shape으로만 변환 가능하다.
    - 원본 배열을 변경시지 않는다. (shape을 바꾼 새로운 배열(카피본)을 반환)

In [2]:
import numpy as np

In [5]:
a = np.arange(20)
print(a.shape)
print(a.size)
a

(20,)
20


array([ 0,  1,  2,  3,  4,  5,  6,  7,  8,  9, 10, 11, 12, 13, 14, 15, 16,
       17, 18, 19])

In [6]:
b = np.reshape(a, (4,5))
print(b.shape)
print(b.size)
b

(4, 5)
20


array([[ 0,  1,  2,  3,  4],
       [ 5,  6,  7,  8,  9],
       [10, 11, 12, 13, 14],
       [15, 16, 17, 18, 19]])

In [8]:
c = a.reshape((4,5))
print(c.shape)
print(c.size)
c

(4, 5)
20


array([[ 0,  1,  2,  3,  4],
       [ 5,  6,  7,  8,  9],
       [10, 11, 12, 13, 14],
       [15, 16, 17, 18, 19]])

In [9]:
a

array([ 0,  1,  2,  3,  4,  5,  6,  7,  8,  9, 10, 11, 12, 13, 14, 15, 16,
       17, 18, 19])

In [10]:
d = a.reshape(4,5)
d

array([[ 0,  1,  2,  3,  4],
       [ 5,  6,  7,  8,  9],
       [10, 11, 12, 13, 14],
       [15, 16, 17, 18, 19]])

In [11]:
e = a.reshape(2,2,5) 
print(e.size)
print(e.shape)
e

20
(2, 2, 5)


array([[[ 0,  1,  2,  3,  4],
        [ 5,  6,  7,  8,  9]],

       [[10, 11, 12, 13, 14],
        [15, 16, 17, 18, 19]]])

In [12]:
np.reshape(a, (3,3)) #a.size: 20 ->reshape.size:6 size가 다르면 안된다.

ValueError: cannot reshape array of size 20 into shape (3,3)

In [15]:
f = np.arange(5*5*5).reshape(5,5,5)
g = np.arange(3*2*7).reshape(3,2,7)

In [16]:
print(f.shape, g.shape)

(5, 5, 5) (3, 2, 7)


In [19]:
# f -> 1차원
f_1 = np.reshape(f, 125) #newshape에 정수를 넣으면 1차원 배열로 변환
print(f_1.shape)
f_1

(125,)


array([  0,   1,   2,   3,   4,   5,   6,   7,   8,   9,  10,  11,  12,
        13,  14,  15,  16,  17,  18,  19,  20,  21,  22,  23,  24,  25,
        26,  27,  28,  29,  30,  31,  32,  33,  34,  35,  36,  37,  38,
        39,  40,  41,  42,  43,  44,  45,  46,  47,  48,  49,  50,  51,
        52,  53,  54,  55,  56,  57,  58,  59,  60,  61,  62,  63,  64,
        65,  66,  67,  68,  69,  70,  71,  72,  73,  74,  75,  76,  77,
        78,  79,  80,  81,  82,  83,  84,  85,  86,  87,  88,  89,  90,
        91,  92,  93,  94,  95,  96,  97,  98,  99, 100, 101, 102, 103,
       104, 105, 106, 107, 108, 109, 110, 111, 112, 113, 114, 115, 116,
       117, 118, 119, 120, 121, 122, 123, 124])

- newshape을 지정할 때 특정 축에 -1을 주면 원소수에 맞춰서 size를 정한다. (전체 축중에 하나만 사용가능)

In [20]:
f_2 = np.reshape(f, -1)
print(f_2.shape)
f_2


(125,)


array([  0,   1,   2,   3,   4,   5,   6,   7,   8,   9,  10,  11,  12,
        13,  14,  15,  16,  17,  18,  19,  20,  21,  22,  23,  24,  25,
        26,  27,  28,  29,  30,  31,  32,  33,  34,  35,  36,  37,  38,
        39,  40,  41,  42,  43,  44,  45,  46,  47,  48,  49,  50,  51,
        52,  53,  54,  55,  56,  57,  58,  59,  60,  61,  62,  63,  64,
        65,  66,  67,  68,  69,  70,  71,  72,  73,  74,  75,  76,  77,
        78,  79,  80,  81,  82,  83,  84,  85,  86,  87,  88,  89,  90,
        91,  92,  93,  94,  95,  96,  97,  98,  99, 100, 101, 102, 103,
       104, 105, 106, 107, 108, 109, 110, 111, 112, 113, 114, 115, 116,
       117, 118, 119, 120, 121, 122, 123, 124])

In [21]:
a

array([ 0,  1,  2,  3,  4,  5,  6,  7,  8,  9, 10, 11, 12, 13, 14, 15, 16,
       17, 18, 19])

In [22]:
a_1 = np.reshape(a, (5,-1)) #5X?=20
print(a_1.shape)
a_1

(5, 4)


array([[ 0,  1,  2,  3],
       [ 4,  5,  6,  7],
       [ 8,  9, 10, 11],
       [12, 13, 14, 15],
       [16, 17, 18, 19]])

In [23]:
a_2 = a.reshape(2,2,-1)  #20=2X2X?
print(a_2.shape)
a_2

(2, 2, 5)


array([[[ 0,  1,  2,  3,  4],
        [ 5,  6,  7,  8,  9]],

       [[10, 11, 12, 13, 14],
        [15, 16, 17, 18, 19]]])

In [24]:
np.reshape(a_2, -1)  #1차원

array([ 0,  1,  2,  3,  4,  5,  6,  7,  8,  9, 10, 11, 12, 13, 14, 15, 16,
       17, 18, 19])

## 차원 늘리기(확장)

### numpy.newaxis 속성을 이용해 차원 늘리기
- size가 1인 축(axis)를 늘릴때 사용한다. 
    - 지정한 axis에 size 1인 축을 추가한다.
- slicing에 사용하거나 indexing에 `...`과 같이 사용한다.
    - slicing의 경우 원하는 위치의 축을 늘릴 수 있다.
    - index에 ...과 사용하는 경우 첫번째나 마지막 축을 늘릴때 사용한다.
    

In [25]:
import numpy as np
a = np.arange(1, 6)
print(a.shape)
print(a)

(5,)
[1 2 3 4 5]


In [27]:
#(5,) => (1,5)
x = a[np.newaxis, :]
print(x.shape)
x

(1, 5)


array([[1, 2, 3, 4, 5]])

In [30]:
#a: (5,) => y: (5, 1)
y = a[:, np.newaxis]
print(y.shape)
y

(5, 1)


array([[1],
       [2],
       [3],
       [4],
       [5]])

In [None]:
# a: (5, ) => z: (1, 5, 1, 1, 1)

In [33]:
z = a[np.newaxis, : , np.newaxis, np.newaxis, np.newaxis]
print(z.shape)
z

(1, 5, 1, 1, 1)


array([[[[[1]]],


        [[[2]]],


        [[[3]]],


        [[[4]]],


        [[[5]]]]])

In [35]:
b = np.arange(6).reshape(2,3)
print(b.shape)
b

(2, 3)


array([[0, 1, 2],
       [3, 4, 5]])

In [None]:
# b: (2,3) => m: (1,2,3)

In [36]:
m = b[np.newaxis, : , :]
print(m.shape)
m

(1, 2, 3)


array([[[0, 1, 2],
        [3, 4, 5]]])

In [38]:
# b: (2,3) n: (2,3,1)
n = b[:, : , np.newaxis]
print(n.shape)
n

(2, 3, 1)


array([[[0],
        [1],
        [2]],

       [[3],
        [4],
        [5]]])

In [39]:
# (2,3) => (2, 1, 3, 1)
o = b[ :, np.newaxis, :, np.newaxis]
print(o.shape)
o

(2, 1, 3, 1)


array([[[[0],
         [1],
         [2]]],


       [[[3],
         [4],
         [5]]]])

### indexing에 ... 과 같이 사용
- ndarray[..., np.newaxis]
- 첫번째 축이나 마지막 축을 늘릴때만 사용가능

In [None]:
(2,3,4) -> (1, 2,3,4)
        -> (2,3,4,  1)

In [41]:
# b: (2,3) -> b2 : (1, 2,3)  #0축을 늘리기
b2 = b[np.newaxis, ...]
print(b2.shape)
b2

(1, 2, 3)


array([[[0, 1, 2],
        [3, 4, 5]]])

In [42]:
#(2,3) -> (2,3,1)
b3 = b[..., np.newaxis]
print(b3.shape)
b3

(2, 3, 1)


array([[[0],
        [1],
        [2]],

       [[3],
        [4],
        [5]]])

In [44]:
np.reshape(b, (2,3,1))

array([[[0],
        [1],
        [2]],

       [[3],
        [4],
        [5]]])

### numpy.expand_dims (배열, axis)
- 매개변수로 받은 배열에 지정한 axis의 rank를 확장한다.

In [48]:
print(a.shape)
a

(5,)


array([1, 2, 3, 4, 5])

In [47]:
# (5,) -> (5,1)
a1 = np.expand_dims(a, axis=1)
a1.shape

(5, 1)

In [49]:
# (5,) -> (1,5)
a2 = np.expand_dims(a, axis=0)
a2.shape

(1, 5)

In [51]:
b.shape

(2, 3)

In [52]:
# (2,3)->(2,1,3)
b1 = np.expand_dims(b, axis=1)
b1.shape

(2, 1, 3)

## 차원 줄이기(축소)

### numpy.squeeze(배열, axis=None), 배열객체.squeeze(axis=None)
- 배열에서 지정한 축(axis)을 제거하여 차원(rank)를 줄인다.
- 제거하려는 축의 size는 1이어야 한다.
- 축을 지정하지 않으면 size가 1인 모든 축을 제거한다.
    - (3,1,1,2) => (3,2)

In [57]:
a = np.arange(12).reshape(1,2,1,2,3,1)
a.shape

(1, 2, 1, 2, 3, 1)

In [58]:
b = np.squeeze(a)
b.shape

(2, 2, 3)

In [59]:
c = np.squeeze(a, axis=2)
c.shape

(1, 2, 2, 3, 1)

In [60]:
 np.squeeze(a, axis=1) # size가 1이 아닌 축은 제거가 안됨.

ValueError: cannot select an axis to squeeze out which has size not equal to one

### 배열객체.flatten()
- 다차원 배열을 1차원으로 만든다.

In [61]:
# (2,3) -> (6,)
# (2,2,2,3) -> (24, )
a = np.arange(20).reshape(2,2,5)
a.shape

(2, 2, 5)

In [62]:
a2 = a.flatten()
a2.shape

(20,)

In [64]:
a

array([[[ 0,  1,  2,  3,  4],
        [ 5,  6,  7,  8,  9]],

       [[10, 11, 12, 13, 14],
        [15, 16, 17, 18, 19]]])

In [63]:
a2

array([ 0,  1,  2,  3,  4,  5,  6,  7,  8,  9, 10, 11, 12, 13, 14, 15, 16,
       17, 18, 19])

## numpy.append(), numpy.insert(), numpy.delete()
- ### append(배열, 추가할값, axis=None)
    - 배열의 마지막 index에 추가할값을 추가
    - axis : 축 지정
        - None(기본값) : flatten 한 뒤 추가한다.
- ### insert(배열, index, 추가할값, axis=None)
    - 배열의 index에 추가할값을 추가. 
    - axis : 축 지정
        - None(기본값) : flatten 한 뒤 삽입한다.
- ### delete(배열, 삭제할index, axis=None)  
    - 배열의 삭제할index의 값들을 삭제한다.
    - 삭제할 index는 index 또는 slice
    - axis : 축 지정
        - None(기본값) : flatten 한 뒤 삭제한다.

### append()

In [65]:
import numpy as np

a = np.array([1,2,3]) 

In [66]:
r = np.append(a, 100) # 1개의 값을 추가
r

array([  1,   2,   3, 100])

In [68]:
r = np.append(a, [200,300,400]) # 여러개 값 동시에 추가. 리스트로 묶어서 전달.
r

array([  1,   2,   3, 200, 300, 400])

In [69]:
l = [
    [1,1],
    [2,2],
    [3,3]
]
b = np.array(l)
print(b.shape)
b

(3, 2)


array([[1, 1],
       [2, 2],
       [3, 3]])

In [72]:
r = np.append(b, [[4,4]], axis=0)
r

array([[1, 1],
       [2, 2],
       [3, 3],
       [4, 4]])

In [74]:
r = np.append(b, [[4,4],[5,5],[6,6]], axis=0)
r

array([[1, 1],
       [2, 2],
       [3, 3],
       [4, 4],
       [5, 5],
       [6, 6]])

In [79]:
r = np.append(b,[[1], [2], [3]] , axis=1)
r

array([[1, 1, 1],
       [2, 2, 2],
       [3, 3, 3]])

In [82]:
r = np.append(b, [[4,4,4], [5,5,5], [6,6,6]], axis=1)
r

array([[1, 1, 4, 4, 4],
       [2, 2, 5, 5, 5],
       [3, 3, 6, 6, 6]])

In [84]:
np.append(b, [10,20]) #다차원배열에서 axis생략: flatten() 후에 append()

array([ 1,  1,  2,  2,  3,  3, 10, 20])

In [85]:
b

array([[1, 1],
       [2, 2],
       [3, 3]])

### insert

In [86]:
a = np.array([1,2,3])
a

array([1, 2, 3])

In [87]:
r = np.insert(a, 0, 100) #index 0에 100을 삽입
r

array([100,   1,   2,   3])

In [88]:
r = np.insert(a, 2, 200)
r

array([  1,   2, 200,   3])

In [90]:
# np.insert(a, 10, 5) # a: 0 ~ 2, 10

In [91]:
a

array([1, 2, 3])

In [92]:
r = np.insert(a, 1, [10,20,30])
r

array([ 1, 10, 20, 30,  2,  3])

In [93]:
b = np.array([[1,1],[2,2],[3,3]])
b

array([[1, 1],
       [2, 2],
       [3, 3]])

In [95]:
np.insert(b, 1, 100) #axis 생략. flatten() 뒤에 insert()

array([  1, 100,   1,   2,   2,   3,   3])

In [99]:
np.insert(b, 1, [10,10], axis=0)

array([[ 1,  1],
       [10, 10],
       [ 2,  2],
       [ 3,  3]])

In [98]:
np.insert(b, 1,[[10,10],[20,20]], axis=0)

array([[ 1,  1],
       [10, 10],
       [20, 20],
       [ 2,  2],
       [ 3,  3]])

In [101]:
np.insert(b, 2, 100, axis=0) #동일한 값을 넣을 경우 정수로 넣어줘도 된다.

array([[  1,   1],
       [  2,   2],
       [100, 100],
       [  3,   3]])

In [103]:
np.insert(b, 0, [4,5,6], axis=1)

array([[4, 1, 1],
       [5, 2, 2],
       [6, 3, 3]])

In [104]:
np.insert(b, 1, [10,20,30], axis=1)

array([[ 1, 10,  1],
       [ 2, 20,  2],
       [ 3, 30,  3]])

In [105]:
np.insert(b, 1, [[10,20,30],[5,6,7]], axis=1)

array([[ 1, 10,  5,  1],
       [ 2, 20,  6,  2],
       [ 3, 30,  7,  3]])

### delete

In [107]:
a = np.arange(10)
a

array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])

In [108]:
r = np.delete(a, 0)
r

array([1, 2, 3, 4, 5, 6, 7, 8, 9])

In [110]:
r = np.delete(a, [2,5,6])
r

array([0, 1, 3, 4, 7, 8, 9])

In [113]:
#slicing을 이용해서 삭제
# slicing을 함수의 매개변수로 전달할 경우 np.s_[slicing]
np.delete(a, np.s_[::2])

array([1, 3, 5, 7, 9])

In [112]:
배열[] 를 제외한 []는 다 리스트표기

array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])

In [114]:
b = np.arange(36).reshape(6,6)
b.shape

(6, 6)

In [115]:
b

array([[ 0,  1,  2,  3,  4,  5],
       [ 6,  7,  8,  9, 10, 11],
       [12, 13, 14, 15, 16, 17],
       [18, 19, 20, 21, 22, 23],
       [24, 25, 26, 27, 28, 29],
       [30, 31, 32, 33, 34, 35]])

In [116]:
np.delete(b, [0,1], axis=0)

array([[12, 13, 14, 15, 16, 17],
       [18, 19, 20, 21, 22, 23],
       [24, 25, 26, 27, 28, 29],
       [30, 31, 32, 33, 34, 35]])

In [117]:
np.delete(b, [0, 1], axis=1)

array([[ 2,  3,  4,  5],
       [ 8,  9, 10, 11],
       [14, 15, 16, 17],
       [20, 21, 22, 23],
       [26, 27, 28, 29],
       [32, 33, 34, 35]])

In [118]:
np.delete(b, 0) #axis생략: flatten()후에 delete()

array([ 1,  2,  3,  4,  5,  6,  7,  8,  9, 10, 11, 12, 13, 14, 15, 16, 17,
       18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34,
       35])

In [119]:
k= np.arange(12).reshape(2,2,3)
k

array([[[ 0,  1,  2],
        [ 3,  4,  5]],

       [[ 6,  7,  8],
        [ 9, 10, 11]]])

In [124]:
np.append(k,[[[1,1,1]],[[2,2,2]]], axis=1)

array([[[ 0,  1,  2],
        [ 3,  4,  5],
        [ 1,  1,  1]],

       [[ 6,  7,  8],
        [ 9, 10, 11],
        [ 2,  2,  2]]])

## 배열 합치기
- ### np.concatenate(합칠 배열리스트, axis=0)
    - 여러 배열을 **축의개수(rank)**를 유지하며 합친다.
    - axis 파라미터 : 축지정
        - 지정된 축을 기준으로 합친다. 
        - default : 0
    - 합치는 배열의 축의 개수(rank) 은 같아야 한다.
    - axis속성으로 지정한 축 이외의 축의 크기가 같아야 한다.
    - 결과의 축의개수(rank)는 대상 배열의 rank와 같다.
        - 1차원끼리 합치면 1차원결과가 나옴
- ### 합칠 대상 배열의 rank가 2일 경우(행렬) 
    - vstack()
    - hstack()
    - np.concatenate()의 간단버전
- ### vstack(합칠배열리스트)
    - 수직으로 쌓는다.
    - concatenate() 의 axis=0 와 동일
    - 합칠 배열들의 열수가 같아야 한다.
- ### hstack(합칠배열리스트)
    - 수평으로 쌓는다.
    - concatenate() 의 axis=1 와 동일
    - 합칠 배열들의 행 수가 같아야 한다.

a: (3,2), b: (3,5)   : axis=1 (3, 7)
a: (4,2), b: (4,2)   : axis=0 (8, 2), axis=1: (4,4)
a: (2, 3, 5), b: (3, 1, 5)  : XXX
a: (2, 3, 5), b: (7, 3, 5) : axis=0, (9, 3, 5)

In [159]:
a = np.random.choice([True,False],size = 20)


np.unique(a)



array([False,  True])

### concatenate()

- axis=0 이면 0이 늘어난다. 0을 기준으로 합치므로 (그래서 밑으로 (행이 늘어남)붙는다.)
    - 그래서 각 배열의 컬럼 수가 같아야 한다. 
- axis=1 이면 1이 늘어난다. 1을 기준으로 합치므로 (그래서 옆으로 (컬럼이 늘어남) 붙는다.)
    - 그래서 각 배열의 행수가 같아야 한다.

In [125]:
import numpy as np
a = np.array([1,2,3])
b = np.array([10,20,30,40])
c = np.array([100,200])
# 1차원배열 합치기
d = np.concatenate([a, b])
d

array([ 1,  2,  3, 10, 20, 30, 40])

In [126]:
e = np.concatenate([b, a])
e

array([10, 20, 30, 40,  1,  2,  3])

In [128]:
np.concatenate([a,b,c])

array([  1,   2,   3,  10,  20,  30,  40, 100, 200])

In [130]:
x = np.arange(6).reshape(2,3)
y = np.arange(10,16).reshape(2,3)
z = np.arange(20,26).reshape(2,3)
print(x.shape, y.shape, z.shape)

(2, 3) (2, 3) (2, 3)


In [134]:
r = np.concatenate([x, y], axis=0)
print(r.shape)
r

(4, 3)


array([[ 0,  1,  2],
       [ 3,  4,  5],
       [10, 11, 12],
       [13, 14, 15]])

In [135]:
r = np.concatenate([x,y], axis=1)
print(r.shape)
r


(2, 6)


array([[ 0,  1,  2, 10, 11, 12],
       [ 3,  4,  5, 13, 14, 15]])

In [137]:
r = np.concatenate([x, y, z], axis=0)
print(r.shape)
print(r)

(6, 3)
[[ 0  1  2]
 [ 3  4  5]
 [10 11 12]
 [13 14 15]
 [20 21 22]
 [23 24 25]]


In [138]:
w = np.arange(10).reshape(2,5)
w.shape

(2, 5)

In [139]:
np.concatenate([x, w], axis=0)

ValueError: all the input array dimensions for the concatenation axis must match exactly, but along dimension 1, the array at index 0 has size 3 and the array at index 1 has size 5

In [140]:
np.concatenate([x, w], axis=1)

array([[0, 1, 2, 0, 1, 2, 3, 4],
       [3, 4, 5, 5, 6, 7, 8, 9]])

In [141]:
a = np.arange(12).reshape(2,2,3)
a.shape

(2, 2, 3)

In [142]:
b = np.arange(2*2*7).reshape(2,2,7)
b.shape

(2, 2, 7)

In [143]:
r = np.concatenate([a, b], axis=2)
print(r.shape)
r

(2, 2, 10)


array([[[ 0,  1,  2,  0,  1,  2,  3,  4,  5,  6],
        [ 3,  4,  5,  7,  8,  9, 10, 11, 12, 13]],

       [[ 6,  7,  8, 14, 15, 16, 17, 18, 19, 20],
        [ 9, 10, 11, 21, 22, 23, 24, 25, 26, 27]]])

### vstack()
- 아래에 붙이는 개념이므로 열수가 맞아야 한다. 
- axis=0과 동일

In [145]:
x.shape, y.shape, z.shape

((2, 3), (2, 3), (2, 3))

In [146]:
np.vstack([x, y])

array([[ 0,  1,  2],
       [ 3,  4,  5],
       [10, 11, 12],
       [13, 14, 15]])

In [147]:
np.vstack([x, y, z])

array([[ 0,  1,  2],
       [ 3,  4,  5],
       [10, 11, 12],
       [13, 14, 15],
       [20, 21, 22],
       [23, 24, 25]])

In [148]:
w.shape

(2, 5)

In [149]:
np.vstack([x, w])  #1축의 개수가 같아야 한다.

ValueError: all the input array dimensions for the concatenation axis must match exactly, but along dimension 1, the array at index 0 has size 3 and the array at index 1 has size 5

### hstack()
- 옆으로 붙이는 것이므로 행 수가 같아야 한다.
- axis=1과 동일

In [150]:
np.hstack([x, y, z]) 

array([[ 0,  1,  2, 10, 11, 12, 20, 21, 22],
       [ 3,  4,  5, 13, 14, 15, 23, 24, 25]])

In [151]:
np.hstack([x, w])

array([[0, 1, 2, 0, 1, 2, 3, 4],
       [3, 4, 5, 5, 6, 7, 8, 9]])

In [152]:
r = np.arange(15).reshape(3,5)
r.shape

(3, 5)

In [153]:
np.hstack([x,r])

ValueError: all the input array dimensions for the concatenation axis must match exactly, but along dimension 0, the array at index 0 has size 2 and the array at index 1 has size 3

## 배열 분할 하기
- ### split(배열, 분할기준, axis)
    - 지정한 축을 기준으로 배열을 나눈다.. 
    - 반환값: 분할한 narray를 가진 리스트로 리턴.
    - 배열: 분할할 배열
    - 분할기준
        - 정수 : 지정 개수만큼 분할
        - 리스트 : 분할 기준 index들
    - axis(축)
        - 분할할 기준 축을 지정한다. axis = 0 (기본) 
        - 2D의 경우 axis=0: 행 기준 분할, axis=1: 열 기준 분할
- ### vsplit(배열, 분할기준)
    - 행 기준 분할
    - split()의 axis=0과 동일
    - 분할기준
        - 정수 : 지정 개수만큼 분할
        - 리스트 : 분할 기준 index들
- ### hsplit(배열, 분할기준)
    - 열 기준 분할
    - split()의 axis=1과 동일
    - 분할기준
        - 정수 : 지정 개수만큼 분할
        - 리스트 : 분할 기준 index들
- **주의:** 분할기준을 정수(개수)로 할 경우 분할후 원소수가 같아야 한다. 

In [1]:
import numpy as np

In [2]:
a = np.arange(10)
a

array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])

In [5]:
r = np.split(a, 2)  #2개로 분할
print(type(r))
print(r[0], type(r[0]))
print(r[1], type(r[1]))

<class 'list'>
[0 1 2 3 4] <class 'numpy.ndarray'>
[5 6 7 8 9] <class 'numpy.ndarray'>


In [6]:
np.split(a, 3) #3개로 분할
# 분할된 배열의 크기가 동일해야 한다.

ValueError: array split does not result in an equal division

In [8]:
r = np.split(a, [2,6])  #index:2, 6을 기준으로 분할
r

[array([0, 1]), array([2, 3, 4, 5]), array([6, 7, 8, 9])]

In [9]:
a

array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])

In [12]:
np.split(a, [4])  # [4]: index 4를 기준으로 분할,   4: 4개로 분할

[array([0, 1, 2, 3]), array([4, 5, 6, 7, 8, 9])]

In [15]:
b = np.arange(16).reshape(4,4)
print(b.shape)
b

(4, 4)


array([[ 0,  1,  2,  3],
       [ 4,  5,  6,  7],
       [ 8,  9, 10, 11],
       [12, 13, 14, 15]])

In [16]:
r = np.split(b, 2) #axis 기본값: 0
r[0]

array([[0, 1, 2, 3],
       [4, 5, 6, 7]])

In [17]:
r[1]

array([[ 8,  9, 10, 11],
       [12, 13, 14, 15]])

In [18]:
r = np.split(b, 2, axis=1)
r[0]

array([[ 0,  1],
       [ 4,  5],
       [ 8,  9],
       [12, 13]])

In [19]:
r[1]

array([[ 2,  3],
       [ 6,  7],
       [10, 11],
       [14, 15]])

In [23]:
b

array([[ 0,  1,  2,  3],
       [ 4,  5,  6,  7],
       [ 8,  9, 10, 11],
       [12, 13, 14, 15]])

In [21]:
r = np.split(b, [1], axis=0)
r

[array([[0, 1, 2, 3]]),
 array([[ 4,  5,  6,  7],
        [ 8,  9, 10, 11],
        [12, 13, 14, 15]])]

In [24]:
r = np.split(b, [1, 3], axis=0)
r

[array([[0, 1, 2, 3]]),
 array([[ 4,  5,  6,  7],
        [ 8,  9, 10, 11]]),
 array([[12, 13, 14, 15]])]

In [25]:
c = np.arange(6*6*8).reshape(6,6,8)
c.shape

(6, 6, 8)

In [27]:
r = np.split(c, 2, axis=0)
print(r[0].shape, r[1].shape)

(3, 6, 8) (3, 6, 8)


In [28]:
r = np.split(c, [2,5], axis=2)
print(r[0].shape, r[1].shape, r[2].shape)

(6, 6, 2) (6, 6, 3) (6, 6, 3)


In [29]:
r[0]

array([[[  0,   1],
        [  8,   9],
        [ 16,  17],
        [ 24,  25],
        [ 32,  33],
        [ 40,  41]],

       [[ 48,  49],
        [ 56,  57],
        [ 64,  65],
        [ 72,  73],
        [ 80,  81],
        [ 88,  89]],

       [[ 96,  97],
        [104, 105],
        [112, 113],
        [120, 121],
        [128, 129],
        [136, 137]],

       [[144, 145],
        [152, 153],
        [160, 161],
        [168, 169],
        [176, 177],
        [184, 185]],

       [[192, 193],
        [200, 201],
        [208, 209],
        [216, 217],
        [224, 225],
        [232, 233]],

       [[240, 241],
        [248, 249],
        [256, 257],
        [264, 265],
        [272, 273],
        [280, 281]]])

In [30]:
r[1]

array([[[  2,   3,   4],
        [ 10,  11,  12],
        [ 18,  19,  20],
        [ 26,  27,  28],
        [ 34,  35,  36],
        [ 42,  43,  44]],

       [[ 50,  51,  52],
        [ 58,  59,  60],
        [ 66,  67,  68],
        [ 74,  75,  76],
        [ 82,  83,  84],
        [ 90,  91,  92]],

       [[ 98,  99, 100],
        [106, 107, 108],
        [114, 115, 116],
        [122, 123, 124],
        [130, 131, 132],
        [138, 139, 140]],

       [[146, 147, 148],
        [154, 155, 156],
        [162, 163, 164],
        [170, 171, 172],
        [178, 179, 180],
        [186, 187, 188]],

       [[194, 195, 196],
        [202, 203, 204],
        [210, 211, 212],
        [218, 219, 220],
        [226, 227, 228],
        [234, 235, 236]],

       [[242, 243, 244],
        [250, 251, 252],
        [258, 259, 260],
        [266, 267, 268],
        [274, 275, 276],
        [282, 283, 284]]])

## hsplit()/vsplit()

In [31]:
c = np.arange(64).reshape(8,8)
c.shape

(8, 8)

In [32]:
# vsplit() => split(axis=0)
r = np.vsplit(c, 4)
print(r[0].shape, r[1].shape, r[2].shape, r[3].shape)

(2, 8) (2, 8) (2, 8) (2, 8)


In [34]:
r = np.vsplit(c, [3,6])
print(r[0].shape, r[1].shape, r[2].shape)

(3, 8) (3, 8) (2, 8)


In [None]:
# hsplit() => split(axis=1)

In [33]:
r = np.hsplit(c, 4)
print(r[0].shape, r[1].shape, r[2].shape, r[3].shape)

(8, 2) (8, 2) (8, 2) (8, 2)


In [35]:
r = np.hsplit(c, [2, 5])
print(r[0].shape, r[1].shape, r[2].shape)

(8, 2) (8, 3) (8, 3)


In [36]:
np.hsplit(c, 5)

ValueError: array split does not result in an equal division