# 배열의 형태(shape) 변경

## reshape()을 이용한 차원 변경 **중요
- `numpy.reshape(a, newshape)` 또는 `ndarray.reshape(newshape)`
    - a: 형태를 변경할 배열
    - newshape : 변경할 형태 설정. 
        - 원소의 개수를 유지하는 shape으로만 변환 가능하다.
        - 원본은 그대로있음

In [1]:
import numpy as np

In [2]:
x = np.arange(20)
x.shape

(20,)

In [3]:
x

array([ 0,  1,  2,  3,  4,  5,  6,  7,  8,  9, 10, 11, 12, 13, 14, 15, 16,
       17, 18, 19])

In [5]:
r1 = np.reshape(x,(4,5))
r1.shape

(4, 5)

In [8]:
r2 = np.reshape(x,(2,5,2))
r2.shape

(2, 5, 2)

In [9]:
r2

array([[[ 0,  1],
        [ 2,  3],
        [ 4,  5],
        [ 6,  7],
        [ 8,  9]],

       [[10, 11],
        [12, 13],
        [14, 15],
        [16, 17],
        [18, 19]]])

In [11]:
x.size

20

In [12]:
x.reshape(4,-1) # -1은 그냥 변수처리라고생각,알아서 해결해줌, 하나의 축은 -1로가능

array([[ 0,  1,  2,  3,  4],
       [ 5,  6,  7,  8,  9],
       [10, 11, 12, 13, 14],
       [15, 16, 17, 18, 19]])

## 차원 늘리기(확장)
- dummy axis를 추가
    -dummy axis : size가 1인 axis(축)

### numpy.newaxis 속성을 이용해 차원 늘리기
- size가 1인 rank를 늘릴때 사용한다. 
    - 지정한 axis에 size 1인 축을 추가한다.
- slicing에 사용하거나 indexing에 `...`과 같이 사용한다.
    - slicing의 경우 원하는 위치의 축을 늘릴 수 있다.
    - index에 ...과 사용하는 경우 첫번째나 마지막 축을 늘릴때 사용한다.
    

In [13]:
x.shape

(20,)

In [None]:
(20,) -> (20,1)

In [15]:
r = x[:, np.newaxis] #유지하고싶은곳에 : 를적고 늘리고싶은곳에 np.newaxis를적음
print(r.shape)
r

(20, 1)


array([[ 0],
       [ 1],
       [ 2],
       [ 3],
       [ 4],
       [ 5],
       [ 6],
       [ 7],
       [ 8],
       [ 9],
       [10],
       [11],
       [12],
       [13],
       [14],
       [15],
       [16],
       [17],
       [18],
       [19]])

In [17]:
r2 = x[np.newaxis, :]
print(r2.shape)
r2

(1, 20)


array([[ 0,  1,  2,  3,  4,  5,  6,  7,  8,  9, 10, 11, 12, 13, 14, 15,
        16, 17, 18, 19]])

### indexing에 ... 과 같이 사용
- ndarray[..., np.newaxis]
- 첫번째 축이나 마지막 축을 늘릴때만 사용가능
- 양쪽끝만되는데 중간과 끝둘다되는 :말고 ...을 쓰는이유는 그냥 많이쓰여서따로 만들었음 

In [18]:
r3 = x[np.newaxis, np.newaxis, ...] # 중간에 축을 늘릴때는 ...을 쓸수없다 :를 써야함
print(r3.shape)
r3

(1, 1, 20)


array([[[ 0,  1,  2,  3,  4,  5,  6,  7,  8,  9, 10, 11, 12, 13, 14, 15,
         16, 17, 18, 19]]])

In [28]:
x = np.arange(12).reshape(3,4)
x.shape
x

array([[ 0,  1,  2,  3],
       [ 4,  5,  6,  7],
       [ 8,  9, 10, 11]])

In [29]:
# (3,4) -> (3,1,4)
r4 = x[:, np.newaxis, :]
r4

array([[[ 0,  1,  2,  3]],

       [[ 4,  5,  6,  7]],

       [[ 8,  9, 10, 11]]])

In [32]:
x[...,np.newaxis].shape
x[np.newaxis,...].shape #내가쓴 축이 몇개가되듯 그냥 ...넣고 새로 추가하고싶은축에 np.newaxis집어넣으면되서 편함

(1, 3, 4)

### numpy.expand_dims (배열, axis)
- 매개변수로 받은 배열에 지정한 axis의 rank를 확장한다.
- 예전꺼라서 알아둘 필요는있음 다른사람들이 이 코드를 사용한 경우가 꽤 있기때문에 그걸 읽으려면 알아야함

In [33]:
x.shape

(3, 4)

In [34]:
# (3,4) => (1,3,4,)
# x[nnp.newaxis, ...]
r = np.expand_dims(x, axis=0)
r.shape

(1, 3, 4)

In [35]:
#(3,4) -> (3,1,4)
r = np.expand_dims(x, axis=1)
r.shape

(3, 1, 4)

In [37]:
#(3,4) -> (3,1,4)
r = np.expand_dims(x, axis=[1,3,4]) # 더미축 여러개쓰는법
r.shape

(3, 1, 4, 1, 1)

## 차원 줄이기(축소)

### numpy.squeeze(배열, axis=None), 배열객체.squeeze(axis=None)
- 배열에서 지정한 축(axis)을 제거하여 차원(rank)를 줄인다.
- 제거하려는 축의 size는 1이어야 한다.
- 축을 지정하지 않으면 size가 1인 모든 축을 제거한다.
    - (3,1,1,2) => (3,2)
- dummy축만 제거가능 data있는 축은 제거불가

In [38]:
x = np.arange(12).reshape(3,1,4,1,1)
x.shape

(3, 1, 4, 1, 1)

In [39]:
r  = x.squeeze() # axis를생략 -> None -> 모든 dummy axis를 제거
r.shape

(3, 4)

In [48]:
r1 = x.squeeze(axis=1) #1번 더미축만제거
r1.shape

(3, 4, 1, 1)

In [49]:
r2 = x.squeeze(axis=(1,3)) #1번,3번 더미축만제거
r2.shape

(3, 4, 1)

In [44]:
r3 = x.squeeze(axis=0) #데이터있는축 제거하려해서 에러뜸

ValueError: cannot select an axis to squeeze out which has size not equal to one

### 배열객체.flatten()
- 다차원 배열을 1차원으로 만든다.

In [45]:
print(x.shape)

(3, 1, 4, 1, 1)


In [50]:
r = x.flatten()
r.shape

(12,)

In [52]:
r

array([ 0,  1,  2,  3,  4,  5,  6,  7,  8,  9, 10, 11])

## numpy.append(), numpy.insert(), numpy.delete()
- ### append(배열, 추가할값, axis=None)
    - 배열의 마지막 index에 추가할값을 추가
    - axis : 축 지정
        - None(기본값) : flatten 한 뒤 추가한다.
- ### insert(배열, index, 추가할값, axis=None)
    - 배열의 index에 추가할값을 추가. 
    - axis : 축 지정
        - None(기본값) : flatten 한 뒤 삽입한다.
- ### delete(배열, 삭제할index, axis=None)  
    - 배열의 삭제할index의 값들을 삭제한다.
    - 삭제할 index는 index 또는 slice
    - axis : 축 지정
        - None(기본값) : flatten 한 뒤 삭제한다.

### append()

In [54]:
a= np. array([1,2,3])
a

array([1, 2, 3])

In [55]:
r = np.append(a,100) # 원본은 그대로 둔 상태에서 값을 추가한 새로운 배열을 만든다.
r

array([  1,   2,   3, 100])

In [57]:
a

array([1, 2, 3])

In [60]:
r = np.append(a, [10,20,30])
r

array([ 1,  2,  3, 10, 20, 30])

In [61]:
b = np.arange(12).reshape(3,4)
print(b.shape)
b

(3, 4)


array([[ 0,  1,  2,  3],
       [ 4,  5,  6,  7],
       [ 8,  9, 10, 11]])

In [62]:
np.append(b,100) # axis지정안하면 1차원으로 변경후 추가

array([  0,   1,   2,   3,   4,   5,   6,   7,   8,   9,  10,  11, 100])

In [68]:
np.append(b,[[10],[20],[30]] ,axis =1) # 모양을 맞춰줘야함

array([[ 0,  1,  2,  3, 10],
       [ 4,  5,  6,  7, 20],
       [ 8,  9, 10, 11, 30]])

In [71]:
np.append(b,[[12,13,14,15]], axis=0)

array([[ 0,  1,  2,  3],
       [ 4,  5,  6,  7],
       [ 8,  9, 10, 11],
       [12, 13, 14, 15]])

### insert

In [74]:
a= np.array([1,2,3])
a

array([1, 2, 3])

In [76]:
# [1,100,2,3]
r = np.insert(a,1,100) #index1에 100을 삽입
r

array([  1, 100,   2,   3])

In [77]:
r = np.insert(a,1,[10,20,30,40]) # 한번에 여러개값을 insert
r

array([ 1, 10, 20, 30, 40,  2,  3])

In [78]:
ls = [
    [1,1],
    [2,2],
    [3,3]
]
b = np.array(ls)
print(b.shape)
b

(3, 2)


array([[1, 1],
       [2, 2],
       [3, 3]])

In [81]:
np.insert(b,1,1000)  # 다차원(2차원) 배열에서 axis를 지정하지 않으면 1차원으로 변경후 insert

array([   1, 1000,    1,    2,    2,    3,    3])

In [82]:
np.insert(b, 2, [10,10], axis=0)

array([[ 1,  1],
       [ 2,  2],
       [10, 10],
       [ 3,  3]])

In [83]:
np.insert(b, 2, [[10,10]], axis=0) # 삽입할때 1차원으로 넣어도 되지만 append는 2차원으로 넣어야되서 헷갈릴수도있다.
                                    # 그래서 혼동방지를 위해 둘다 2차원으로 넣자

array([[ 1,  1],
       [ 2,  2],
       [10, 10],
       [ 3,  3]])

In [88]:
np.insert(b, 1, 5,axis=1) # 동일한 값을 넣을 경우 정수

array([[1, 5, 1],
       [2, 5, 2],
       [3, 5, 3]])

In [89]:
np.insert(b, 1, [[5,50,500]], axis=1)  

array([[  1,   5,   1],
       [  2,  50,   2],
       [  3, 500,   3]])

In [93]:
np.insert(b, 1, [[5,50,500],[6,60,600]], axis=1) 

array([[  1,   5,   6,   1],
       [  2,  50,  60,   2],
       [  3, 500, 600,   3]])

In [94]:
np.insert(b, 1, [[100],[200]], axis=1) 

array([[  1, 100, 200,   1],
       [  2, 100, 200,   2],
       [  3, 100, 200,   3]])

### delete

In [95]:
a = np.arange(20)
a

array([ 0,  1,  2,  3,  4,  5,  6,  7,  8,  9, 10, 11, 12, 13, 14, 15, 16,
       17, 18, 19])

In [96]:
r = np.delete(a,1)
r

array([ 0,  2,  3,  4,  5,  6,  7,  8,  9, 10, 11, 12, 13, 14, 15, 16, 17,
       18, 19])

In [99]:
r = np.delete(a, [1,7,8]) # 여러 index삭제시 []로 묶어준다.
r 

array([ 0,  2,  3,  4,  5,  6,  9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19])

In [103]:
# np.s_[slicing문법] # 배열과 상관없이 slicing 범위만 지정할 떄 사용하는 numpy 변수
r = np.delete(a, np.s_[2:11])
r

array([ 0,  1, 11, 12, 13, 14, 15, 16, 17, 18, 19])

array([[1, 1],
       [2, 2],
       [3, 3]])

In [105]:
np.delete(b,1) # 다차원 배열에서 axis를 지정안하면flatten후 삭제

array([1, 2, 2, 3, 3])

In [110]:
a = np.delete(b,1,axis=0)
a

array([[1, 1],
       [3, 3]])

In [111]:
a.shape

(2, 2)

In [115]:
a1 = np.delete(b, 0, axis =1)
a1

array([[1],
       [2],
       [3]])

In [116]:
a1.shape

(3, 1)

## 배열 합치기
- ### np.concatenate(합칠 배열리스트, axis=0)
    - 여러 배열을 **축의개수(rank)**를 유지하며 합친다.
    - axis 파라미터 : 축지정
        - 지정된 축을 기준으로 합친다. 
        - default : 0
    - 합치는 배열의 축의 개수(rank) 은 같아야 한다.
    - axis속성으로 지정한 축 이외의 축의 크기가 같아야 한다.
    - 결과의 축의개수(rank)는 대상 배열의 rank와 같다.
        - 1차원끼리 합치면 1차원결과가 나옴
- ### 합칠 대상 배열의 rank가 2일 경우(행렬) 
    - vstack()
    - hstack()
    - np.concatenate()의 간단버전
- ### vstack(합칠배열리스트)
    - 수직으로 쌓는다.
    - concatenate() 의 axis=0 와 동일
    - 합칠 배열들의 열수가 같아야 한다.
- ### hstack(합칠배열리스트)
    - 수평으로 쌓는다.
    - concatenate() 의 axis=1 와 동일
    - 합칠 배열들의 행 수가 같아야 한다.

### concatenate()

- axis=0 이면 0이 늘어난다. 0을 기준으로 합치므로 (그래서 밑으로 (행이 늘어남)붙는다.)
    - 그래서 각 배열의 컬럼 수가 같아야 한다. 
- axis=1 이면 1이 늘어난다. 1을 기준으로 합치므로 (그래서 옆으로 (컬럼이 늘어남) 붙는다.)
    - 그래서 각 배열의 행수가 같아야 한다.

In [1]:
import numpy as np

In [87]:
a = np.arange(12).reshape(2,6)
b = np.arange(10,22).reshape(2,6)
c = np.arange(20,32).reshape(2,6)
a.shape, b.shape, c.shape

((2, 6), (2, 6), (2, 6))

In [4]:
r = np.concatenate([a, b], axis=0) #배열 a와 b를 합친다 기준축은 0번축
r.shape

(4, 6)

In [5]:
r

array([[ 0,  1,  2,  3,  4,  5],
       [ 6,  7,  8,  9, 10, 11],
       [10, 11, 12, 13, 14, 15],
       [16, 17, 18, 19, 20, 21]])

In [9]:
r2 = np.concatenate([a, b, c], axis=0)
r2.shape

(6, 6)

In [10]:
r2

array([[ 0,  1,  2,  3,  4,  5],
       [ 6,  7,  8,  9, 10, 11],
       [10, 11, 12, 13, 14, 15],
       [16, 17, 18, 19, 20, 21],
       [20, 21, 22, 23, 24, 25],
       [26, 27, 28, 29, 30, 31]])

In [12]:
r3 = np.concatenate([a, b, c], axis=1)
r3.shape

(2, 18)

In [13]:
r3

array([[ 0,  1,  2,  3,  4,  5, 10, 11, 12, 13, 14, 15, 20, 21, 22, 23,
        24, 25],
       [ 6,  7,  8,  9, 10, 11, 16, 17, 18, 19, 20, 21, 26, 27, 28, 29,
        30, 31]])

In [14]:
x = np.arange(12).reshape(2,2,3)
y = np.arange(10,26).reshape(2,2,4)
x.shape, y.shape

((2, 2, 3), (2, 2, 4))

In [18]:
r4 = np.concatenate([x, y], axis = 2) # axis = 0과 1은 기준축 제외하고 똑같지 않기떄문에 합치질 못함
r4.shape

(2, 2, 7)

In [19]:
r4

array([[[ 0,  1,  2, 10, 11, 12, 13],
        [ 3,  4,  5, 14, 15, 16, 17]],

       [[ 6,  7,  8, 18, 19, 20, 21],
        [ 9, 10, 11, 22, 23, 24, 25]]])

### vstack()
- 아래에 붙이는 개념이므로 열수가 맞아야 한다. 
- axis=0과 동일

In [21]:
v1 = np.vstack([a, b, c]) # axis=0을 기준으로 합친다
v1.shape

(6, 6)

In [22]:
v1

array([[ 0,  1,  2,  3,  4,  5],
       [ 6,  7,  8,  9, 10, 11],
       [10, 11, 12, 13, 14, 15],
       [16, 17, 18, 19, 20, 21],
       [20, 21, 22, 23, 24, 25],
       [26, 27, 28, 29, 30, 31]])

In [23]:
np.vstack?

In [81]:
x = np.arange(12).reshape(2,2,3)
y = np.arange(12).reshape(2,2,3)
v2 = np.vstack([x,y])
v2.shape

(4, 2, 3)

### hstack()
- 옆으로 붙이는 것이므로 행 수가 같아야 한다.
- axis=1과 동일

In [88]:
h1 = np.hstack([a,b,c])
h1.shape

(2, 18)

In [89]:
h2 = np.hstack([x,y])
h2.shape

(2, 4, 3)

SyntaxError: invalid syntax (<ipython-input-26-310144de3d92>, line 1)

## 배열 분할 하기
- ### split(배열, 분할기준, axis)
    - 지정한 축을 기준으로 배열을 나눈다.. 
    - 반환값: 분할한 narray를 가진 리스트로 리턴. (하나를 여러개로 나눠서 주니까)
    - 배열: 분할할 배열
    - 분할기준
        - 정수 : 지정 개수만큼 분할
        - 리스트 : 분할 기준 index들
    - axis(축)
        - 분할할 기준 축을 지정한다. axis = 0 (기본) 
        - 2D의 경우 axis=0: 행 기준 분할, axis=1: 열 기준 분할
- ### vsplit(배열, 분할기준)
    - 행 기준 분할
    - split()의 axis=0과 동일
    - 분할기준
        - 정수 : 지정 개수만큼 분할
        - 리스트 : 분할 기준 index들
- ### hsplit(배열, 분할기준)
    - 열 기준 분할
    - split()의 axis=1과 동일
    - 분할기준
        - 정수 : 지정 개수만큼 분할
        - 리스트 : 분할 기준 index들
- **주의:** 분할기준을 정수(개수)로 할 경우 분할후 원소수가 같아야 한다. 

In [27]:
a = np.arange(10)
a

array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])

In [30]:
r = np.split(a,2) # 두개의 배열로 나눠라, 나눠진 두 배열의 기준축의 size는 동일
print(type(r))
r

<class 'list'>


[array([0, 1, 2, 3, 4]), array([5, 6, 7, 8, 9])]

In [31]:
r = np.split(a,5)
print(len(r))
r

5


[array([0, 1]), array([2, 3]), array([4, 5]), array([6, 7]), array([8, 9])]

In [38]:
r = np.split(a,3) #같은 크기로 아나눠져서 error가 뜸

In [41]:
r = np.split(a, [3, 7])
print(len(r))
r

3


[array([0, 1, 2]), array([3, 4, 5, 6]), array([7, 8, 9])]

In [61]:
r = np.split(a, [2, 7]) # 2버번에서한번, 7번에서 한번 자른다
print(len(r))
r

3


[array([0, 1]), array([2, 3, 4, 5, 6]), array([7, 8, 9])]

In [40]:
b = np.arange(48).reshape(8,6)
print(b.shape)
b

(8, 6)


array([[ 0,  1,  2,  3,  4,  5],
       [ 6,  7,  8,  9, 10, 11],
       [12, 13, 14, 15, 16, 17],
       [18, 19, 20, 21, 22, 23],
       [24, 25, 26, 27, 28, 29],
       [30, 31, 32, 33, 34, 35],
       [36, 37, 38, 39, 40, 41],
       [42, 43, 44, 45, 46, 47]])

In [50]:
r = np.split(b, 2, axis=0)
print(len(r))
r[0].shape, r[1].shape

2


((4, 6), (4, 6))

In [51]:
r = np.split(b, 3, axis=1)
print(len(r))
r[0].shape, r[1].shape, r[2].shape

3


((8, 2), (8, 2), (8, 2))

In [53]:
r[0]

array([[ 0,  1],
       [ 6,  7],
       [12, 13],
       [18, 19],
       [24, 25],
       [30, 31],
       [36, 37],
       [42, 43]])

In [59]:
r = np.split(b, [2,6], axis=0)
len(r)

3

In [60]:
r[0].shape, r[1].shape, r[2].shape

((2, 6), (4, 6), (2, 6))

In [62]:
c = np.arange(4*4*8).reshape(4,4,8)
c.shape

(4, 4, 8)

In [65]:
r = np.split(c, 2, axis=0)
len(r)

2

In [66]:
r[0].shape, r[1].shape

((2, 4, 8), (2, 4, 8))

In [67]:
r = np.split(c, [3,6], axis=2)
len(r)

3

In [68]:
r[0].shape, r[1].shape, r[2].shape

((4, 4, 3), (4, 4, 3), (4, 4, 2))

In [71]:
x, y, z = r    # 3개 한번에 이름정하는법
x.shape, y.shape, z.shape

((4, 4, 3), (4, 4, 3), (4, 4, 2))

## hsplit()/vsplit()
- vsplit() : axis=0
- hsplit() : axis=1
- 행렬(2차원배열)용 함수, 다차원 배열에도 사용가능

In [73]:
b.shape

(8, 6)

In [74]:
r = np.vsplit(b, 2) #split(b, 2, axis=0)
len(r)

2

In [75]:
x, y = r
x.shape, y.shape

((4, 6), (4, 6))

In [77]:
r = np.vsplit(b, [2, 5, 7])
print(len(r))
w,x,y,z = r
w.shape, x.shape, y.shape, z.shape

4


((2, 6), (3, 6), (2, 6), (1, 6))

In [78]:
r = np.hsplit(b, 3)
print(len(r))
x, y, z = r
x.shape, y.shape, z.shape

3


((8, 2), (8, 2), (8, 2))

In [79]:
x

array([[ 0,  1],
       [ 6,  7],
       [12, 13],
       [18, 19],
       [24, 25],
       [30, 31],
       [36, 37],
       [42, 43]])