# NumPy 한번에 제대로 배우기



---



## NumPy 특징

* Numerical Python의 약자
* 고성능 과학 계산용 패키지로 강력한 N차원 배열 객체
* 범용적 데이터 처리에 사용 가능한 다차원 컨테이너
* **정교한 브로드캐스팅(broadcasting) 기능**
* 파이썬의 자료형 list와 비슷하지만, 더 빠르고 메모리를 효율적으로 관리
* 반복문 없이 데이터 배열에 대한 처리를 지원하여 빠르고 편리
* 데이터 과학 도구에 대한 생태계의 핵심을 이루고 있음

In [1]:
import numpy as np
np.__version__

'1.19.2'



---



## 배열 생성

### 리스트로 배열 만들기


![image.png](attachment:image.png)

In [2]:
a1 = np.array([1, 2, 3, 4, 5])
print(a1)
print(type(a1))
print(a1.shape)
print(a1[0], a1[1], a1[2], a1[3], a1[4])

[1 2 3 4 5]
<class 'numpy.ndarray'>
(5,)
1 2 3 4 5


In [3]:
a1[0] = 9
a1

array([9, 2, 3, 4, 5])

In [4]:
a2 = np.array([[1, 2, 3],[4, 5, 6], [7, 8, 9]])
print(a2)
print(type(a2))
print(a2.shape)
print(a2[0, 0], a2[1, 1], a2[2, 1])

[[1 2 3]
 [4 5 6]
 [7 8 9]]
<class 'numpy.ndarray'>
(3, 3)
1 5 8


In [5]:
a3 = np.array([ [ [1,2,3], [4, 5, 6], [7, 8, 9] ],
                [ [1,2,3], [4, 5, 6], [7, 8, 9] ],
                [ [1,2,3], [4, 5, 6], [7, 8, 9] ], ])
print(a3)
print(type(a3))
print(a3.shape)
print(a3[0, 0, 0], a3[1, 1, 1], a3[2, 2, 2])

[[[1 2 3]
  [4 5 6]
  [7 8 9]]

 [[1 2 3]
  [4 5 6]
  [7 8 9]]

 [[1 2 3]
  [4 5 6]
  [7 8 9]]]
<class 'numpy.ndarray'>
(3, 3, 3)
1 5 9


### 배열 생성 및 초기화

* `zeros()`: 모든 요소를 0으로 초기화

In [6]:
np.zeros(10)

array([0., 0., 0., 0., 0., 0., 0., 0., 0., 0.])

In [7]:
np.zeros(10, np.int64)

array([0, 0, 0, 0, 0, 0, 0, 0, 0, 0], dtype=int64)

* `ones()`: 모든 요소를 1로 초기화

In [8]:
np.ones(10)

array([1., 1., 1., 1., 1., 1., 1., 1., 1., 1.])

In [9]:
np.ones((3, 3))

array([[1., 1., 1.],
       [1., 1., 1.],
       [1., 1., 1.]])

* `full()`: 모든 요소를 지정한 값으로 초기화

In [10]:
np.full((3, 3, 3), 1.22)

array([[[1.22, 1.22, 1.22],
        [1.22, 1.22, 1.22],
        [1.22, 1.22, 1.22]],

       [[1.22, 1.22, 1.22],
        [1.22, 1.22, 1.22],
        [1.22, 1.22, 1.22]],

       [[1.22, 1.22, 1.22],
        [1.22, 1.22, 1.22],
        [1.22, 1.22, 1.22]]])

* `eye()`: 단위행렬(identity matrix) 생성
  + 주대각선의 원소가 모두 1이고 나머지 원소는 모두 0인 정사각 행렬

In [11]:
# 정사각에서만 존재하니까 사이즈만 정해주면 된다.
np.eye(3)

array([[1., 0., 0.],
       [0., 1., 0.],
       [0., 0., 1.]])

* `tri()`: 삼각행렬 생성

In [12]:
np.tri(5)

array([[1., 0., 0., 0., 0.],
       [1., 1., 0., 0., 0.],
       [1., 1., 1., 0., 0.],
       [1., 1., 1., 1., 0.],
       [1., 1., 1., 1., 1.]])

* `empty()`: 초기화되지 않은 배열 생성
  + 초기화가 없어서 배열 생성비용 저렴하고 빠름
  + 초기화되지 않아서 기존 메모리 위치에 존재하는 값이 있음

In [13]:
np.zeros(10)

array([0., 0., 0., 0., 0., 0., 0., 0., 0., 0.])

In [14]:
np.empty(10)

array([0., 0., 0., 0., 0., 0., 0., 0., 0., 0.])

어떤 값이 올지 모른다!!

In [15]:
np.ones(10)

array([1., 1., 1., 1., 1., 1., 1., 1., 1., 1.])

In [16]:
np.empty(10)

array([1., 1., 1., 1., 1., 1., 1., 1., 1., 1.])

* `_like()`: 지정된 배열과 shape가 같은 행렬 생성
  + `np.zeros_like()`
  + `np.ones_like()`
  + `np.full_like()`
  + `np.empty_like()`

In [17]:
print(a1)
np.zeros_like(a1)

[9 2 3 4 5]


array([0, 0, 0, 0, 0])

In [18]:
print(a2)
np.ones_like(a2)

[[1 2 3]
 [4 5 6]
 [7 8 9]]


array([[1, 1, 1],
       [1, 1, 1],
       [1, 1, 1]])

In [19]:
print(a3)
np.full_like(a3, 7)

[[[1 2 3]
  [4 5 6]
  [7 8 9]]

 [[1 2 3]
  [4 5 6]
  [7 8 9]]

 [[1 2 3]
  [4 5 6]
  [7 8 9]]]


array([[[7, 7, 7],
        [7, 7, 7],
        [7, 7, 7]],

       [[7, 7, 7],
        [7, 7, 7],
        [7, 7, 7]],

       [[7, 7, 7],
        [7, 7, 7],
        [7, 7, 7]]])

### 생성한 값으로 배열 생성

* `arange()`: 정수 범위로 배열 생성

In [20]:
np.arange(0, 30, 2)

array([ 0,  2,  4,  6,  8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28])

* `linspace()`: 범위 내에서 균등 간격의 배열 생성

In [21]:
np.linspace(0, 1, 5)

array([0.  , 0.25, 0.5 , 0.75, 1.  ])

* `logspace()`: 범위 내에서 균등간격으로 로그 스케일로 배열 생성

In [22]:
np.logspace(0.1, 10, 10)

array([1.25892541e+00, 1.58489319e+01, 1.99526231e+02, 2.51188643e+03,
       3.16227766e+04, 3.98107171e+05, 5.01187234e+06, 6.30957344e+07,
       7.94328235e+08, 1.00000000e+10])

### 랜덤값으로 배열 생성


![image.png](attachment:image.png)

* `random.random()`: 랜덤한 수의 배열 생성 , 실수 반환

In [23]:
np.random.random((3, 3))

array([[0.60600227, 0.55298875, 0.3375707 ],
       [0.13668289, 0.35000454, 0.67724475],
       [0.447333  , 0.80328162, 0.59037857]])

* `random.randint()`: 일정 구간의 랜덤 정수의 배열 생성

In [24]:
np.random.randint(0, 10, (2,4))

array([[6, 7, 0, 2],
       [1, 3, 1, 2]])

* `random.normal()`: 정규분포(normal distribution)를 고려한 랜덤한 수의 배열 생성
* 평균=0, 표준편차=1, 3 x 3 배열

In [25]:
np.random.normal(0, 1, (3, 3))

array([[-1.01232916,  1.59204296,  0.34414882],
       [ 0.33710992, -1.09941484,  0.64489849],
       [-0.40403264, -0.52889721,  1.04021726]])

In [26]:
np.random.normal(1)

2.0609786659425384

* `random.rand()`: 균등분포(uniform distribution)를 고려한 랜덤한 수의 배열 생성

In [27]:
np.random.rand(3, 3)

array([[0.91954076, 0.27342306, 0.5058055 ],
       [0.23431016, 0.89359053, 0.44416514],
       [0.22480864, 0.98412674, 0.61805658]])

* `random.randn()`: 표준 정규 분포(standard normal distribution)를 고려한 랜덤한 수의 배열 생성

In [28]:
np.random.randn(3, 10)

array([[ 2.42434514,  0.97685665, -0.59113251,  0.1260785 ,  0.4605254 ,
        -0.55738704, -1.6537808 , -0.30717501, -0.39257719,  0.06205621],
       [ 1.45128427, -0.9727218 ,  2.2891226 , -1.34414843,  2.28390373,
         0.63211054, -1.14510252, -0.13108806,  0.56505804,  1.74653935],
       [-1.1927442 ,  0.00396016, -0.27285875, -1.60128464,  0.54093686,
         0.24047021,  2.62971907,  0.57804408, -0.60344405,  0.29331244]])

### 표준 데이터 타입

![image.png](attachment:image.png)

In [29]:
np.zeros(10, dtype=int)

array([0, 0, 0, 0, 0, 0, 0, 0, 0, 0])

In [30]:
np.ones((3, 3), dtype=bool)

array([[ True,  True,  True],
       [ True,  True,  True],
       [ True,  True,  True]])

In [31]:
np.full((3, 3), 1.0, dtype=float)

array([[1., 1., 1.],
       [1., 1., 1.],
       [1., 1., 1.]])

### 날짜/시간 배열 생성


![image.png](attachment:image.png)

In [32]:
date = np.array('2020-01-01', dtype=np.datetime64)
date

array('2020-01-01', dtype='datetime64[D]')

In [33]:
date + np.arange(12)

array(['2020-01-01', '2020-01-02', '2020-01-03', '2020-01-04',
       '2020-01-05', '2020-01-06', '2020-01-07', '2020-01-08',
       '2020-01-09', '2020-01-10', '2020-01-11', '2020-01-12'],
      dtype='datetime64[D]')

In [34]:
datetime =np.datetime64('2020-06-01 12:00')
datetime

numpy.datetime64('2020-06-01T12:00')

In [35]:
datetime = np.datetime64('2020-06-01 12:00:12.34', 'ps')
datetime

numpy.datetime64('1970-02-23T03:47:02.000978561024')



---



## 배열 조회

### 배열 속성 정보

In [36]:
def array_info(array):
    print('info of array')
    print(array)
    print("ndim", array.ndim)
    print("shape:", array.shape)
    print("dtype:", array.dtype)
    print("size:",array.size)
    print("itmesize:", array.itemsize)
    print("nbytes:", array.nbytes)
    print("strides:", array.strides)

In [37]:
array_info(a1)

info of array
[9 2 3 4 5]
ndim 1
shape: (5,)
dtype: int32
size: 5
itmesize: 4
nbytes: 20
strides: (4,)


[9 2 3 4 5]    
ndim 1   
shape: (5,)     
dtype: int32  # 데이터 타입   
size: 5   # 몇개?   
itmesize: 4  # 1개 가지는 용량 size // int32 이니까 4bytes   
nbytes: 20    # size * itemsize   
strides: (4,) # 1개의 차원을 넘어가는데 드는 비용?! 확인 필   

In [38]:
array_info(a2)

info of array
[[1 2 3]
 [4 5 6]
 [7 8 9]]
ndim 2
shape: (3, 3)
dtype: int32
size: 9
itmesize: 4
nbytes: 36
strides: (12, 4)


In [39]:
array_info(a3)

info of array
[[[1 2 3]
  [4 5 6]
  [7 8 9]]

 [[1 2 3]
  [4 5 6]
  [7 8 9]]

 [[1 2 3]
  [4 5 6]
  [7 8 9]]]
ndim 3
shape: (3, 3, 3)
dtype: int32
size: 27
itmesize: 4
nbytes: 108
strides: (36, 12, 4)


### 인덱싱(Indexing)

In [40]:
print(a1)
print(a1[1])
print(a1[-1])

[9 2 3 4 5]
2
5


In [41]:
print(a2)
print(a2[0])
print(a2[0, 2])
print(a2[2, -1])

[[1 2 3]
 [4 5 6]
 [7 8 9]]
[1 2 3]
3
9


In [42]:
print(a3)
print(a3[0])
print(a3[-1,2])
print(a3[0, 0, 0])
print(a3[2, -1, -1])

[[[1 2 3]
  [4 5 6]
  [7 8 9]]

 [[1 2 3]
  [4 5 6]
  [7 8 9]]

 [[1 2 3]
  [4 5 6]
  [7 8 9]]]
[[1 2 3]
 [4 5 6]
 [7 8 9]]
[7 8 9]
1
9


### 슬라이싱(Slicing)

* 슬라이싱 구문: `a[start:stop:step]`
* 기본값: start=0, stop=ndim, step=1

In [43]:
print(a1)
print(a1[0:2])
print(a1[:1])
print(a1[::2])
print(a1[::-1]) # 역순

[9 2 3 4 5]
[9 2]
[9]
[9 3 5]
[5 4 3 2 9]


In [44]:
print(a2)
print('print(a2[1])')
print(a2[1])
print('print(a2[1, :])')
print(a2[1, :])
print('print(a2[:2, :2])')
print(a2[:2, :2])
print('print(a2[1:, ::-1])')
print(a2[1:, ::-1])
print('print(a2[::-1, ::-1])')
print(a2[::-1, ::-1])

[[1 2 3]
 [4 5 6]
 [7 8 9]]
print(a2[1])
[4 5 6]
print(a2[1, :])
[4 5 6]
print(a2[:2, :2])
[[1 2]
 [4 5]]
print(a2[1:, ::-1])
[[6 5 4]
 [9 8 7]]
print(a2[::-1, ::-1])
[[9 8 7]
 [6 5 4]
 [3 2 1]]


### 불리언 인덱싱(Boolean Indexing)

* 배열 각 요소의 선택 여부를 불리언(True or False)로 지정
* True 값인 인덱스의 값만 조회

In [45]:
print(a1)
bi = [False, True, True, False, False]
print(a1[bi])
array_info(a1[bi])

[9 2 3 4 5]
[2 3]
info of array
[2 3]
ndim 1
shape: (2,)
dtype: int32
size: 2
itmesize: 4
nbytes: 8
strides: (4,)


In [46]:
print(a2)
bi = np.random.randint(0,2, (3,3), dtype=bool)
print(bi)
print(a2[bi])

[[1 2 3]
 [4 5 6]
 [7 8 9]]
[[False  True False]
 [False  True  True]
 [False False  True]]
[2 5 6 9]


### 팬시 인덱싱(Fancy Indedxing)

In [47]:
print(a1)
print([a1[0], a1[2]])
ind = [0, 2]
print(a1[ind])

[9 2 3 4 5]
[9, 3]
[9 3]


fancy index 로 나온 결과의 결과값의 shape는 ind 와 동일하다.

In [48]:
ind =np.array([[0, 1],
               [2, 0]])

print(a1[ind])

[[9 2]
 [3 9]]


In [49]:
print(a2)
row = np.array([0, 2])
col = np.array([1, 2])
print(a2[row, col])

[[1 2 3]
 [4 5 6]
 [7 8 9]]
[2 9]


In [50]:
print(a2[row, :])
print(a2[:, col])
print(a2[2, col])
print(a2[1:, col])

[[1 2 3]
 [7 8 9]]
[[2 3]
 [5 6]
 [8 9]]
[8 9]
[[5 6]
 [8 9]]




---



## 배열 값 삽입/수정/삭제/복사

### 배열 값 삽입

* `insert()`: 배열의 특정 위치에 값 삽입
* axis를 지정하지 않으면 1차원 배열로 변환
* 추가할 방향을 axis로 지정
* 원본 배열 변경없이 새로운 배열 반환

![image.png](attachment:image.png)

In [51]:
print(a1)
b1 = np.insert(a1, 0, 10)
b1

[9 2 3 4 5]


array([10,  9,  2,  3,  4,  5])

In [52]:
print(a2)
print(a2.shape)
b2 = np.insert(a2, 1, 10, axis=0)
print(b2)
print(b2.shape)
c3 = np.insert(a2, 1, 10, axis=1)
print(c3)
print(c3.shape)

[[1 2 3]
 [4 5 6]
 [7 8 9]]
(3, 3)
[[ 1  2  3]
 [10 10 10]
 [ 4  5  6]
 [ 7  8  9]]
(4, 3)
[[ 1 10  2  3]
 [ 4 10  5  6]
 [ 7 10  8  9]]
(3, 4)


### 배열 값 수정

* 배열의 인덱싱으로 접근하여 값 수정

한개 한개 지정

In [53]:
print(a1)
a1[0] = 1
a1[1] = 2
a1[2] = 3
print(a1)

[9 2 3 4 5]
[1 2 3 4 5]


인덱싱 : 사용

In [54]:
a1[:2] = 9
print(a1)

[9 9 3 4 5]


facy indexing 사용

In [55]:
i = np.array([1, 3, 4])
a1[i] = 7
a1

array([9, 7, 3, 7, 7])

In [56]:
a1[i] += 4
a1

array([ 9, 11,  3, 11, 11])

In [57]:
print(a2)
a2[0, 0] = 1
a2[1, 1] = 2
a2[2, 2] = 3
a2

[[1 2 3]
 [4 5 6]
 [7 8 9]]


array([[1, 2, 3],
       [4, 2, 6],
       [7, 8, 3]])

In [58]:
a2[0] = 1
a2

array([[1, 1, 1],
       [4, 2, 6],
       [7, 8, 3]])

In [59]:
a2[1:, 2] = 9
a2

array([[1, 1, 1],
       [4, 2, 9],
       [7, 8, 9]])

In [60]:
row = np.array([0, 1])
col = np.array([1, 2])
a2[row, col]=0
a2

array([[1, 0, 1],
       [4, 2, 0],
       [7, 8, 9]])

### 배열 값 삭제

* `delete()`: 배열의 특정 위치에 값 삭제
* axis를 지정하지 않으면 1차원 배열로 변환
* 삭제할 방향을 axis로 지정
* 원본 배열 변경없이 새로운 배열 반환

![image.png](attachment:image.png)

In [61]:
print(a1)
b1 = np.delete(a1, 1)
print(b1)

[ 9 11  3 11 11]
[ 9  3 11 11]


In [62]:
print(a2)
print(a2.shape)
b2 = np.delete(a2, 1, axis=0)
print(b2.shape)
b2

[[1 0 1]
 [4 2 0]
 [7 8 9]]
(3, 3)
(2, 3)


array([[1, 0, 1],
       [7, 8, 9]])

### 배열 복사

* 리스트 자료형과 달리 배열의 슬라이스는 복사본이 아님

동일한 메모리에 위치한 것을 가져 오기 때문에   
서로 영향이 있다. 

방지 하려면 copy()를 사용해야 한다.

In [63]:
print(a2)
print(a2[:2, :2])
a2_sub = a2[:2, :2]
print(a2_sub)
a2_sub[:, 1] =  0 
print(a2_sub)
print(a2)

[[1 0 1]
 [4 2 0]
 [7 8 9]]
[[1 0]
 [4 2]]
[[1 0]
 [4 2]]
[[1 0]
 [4 0]]
[[1 0 1]
 [4 0 0]
 [7 8 9]]



* `copy()`: 배열이나 하위 배열 내의 값을 명시적으로 복사

In [64]:
print(a2)
a2_sub_copy = a2[:2, :2].copy()
print(a2_sub_copy)
a2_sub_copy[:, 1] = 1
print(a2_sub_copy)
print(a2)

[[1 0 1]
 [4 0 0]
 [7 8 9]]
[[1 0]
 [4 0]]
[[1 1]
 [4 1]]
[[1 0 1]
 [4 0 0]
 [7 8 9]]




---



## 배열 변환

### 배열 전치 및 축 변경

대각행렬을 기준으로

In [66]:
print(a2)
print(a2.T)

[[1 0 1]
 [4 0 0]
 [7 8 9]]
[[1 4 7]
 [0 0 8]
 [1 0 9]]


In [67]:
print(a3)
print('Trans-posed')
print(a3.T)

[[[1 2 3]
  [4 5 6]
  [7 8 9]]

 [[1 2 3]
  [4 5 6]
  [7 8 9]]

 [[1 2 3]
  [4 5 6]
  [7 8 9]]]
Trans-posed
[[[1 1 1]
  [4 4 4]
  [7 7 7]]

 [[2 2 2]
  [5 5 5]
  [8 8 8]]

 [[3 3 3]
  [6 6 6]
  [9 9 9]]]


In [68]:
print(a2)
print(a2.swapaxes(1,0))

[[1 0 1]
 [4 0 0]
 [7 8 9]]
[[1 4 7]
 [0 0 8]
 [1 0 9]]


In [70]:
print(a3)
print('')
print(a3.swapaxes(0, 1))
print('')
print(a3.swapaxes(1, 2))

[[[1 2 3]
  [4 5 6]
  [7 8 9]]

 [[1 2 3]
  [4 5 6]
  [7 8 9]]

 [[1 2 3]
  [4 5 6]
  [7 8 9]]]

[[[1 2 3]
  [1 2 3]
  [1 2 3]]

 [[4 5 6]
  [4 5 6]
  [4 5 6]]

 [[7 8 9]
  [7 8 9]
  [7 8 9]]]

[[[1 4 7]
  [2 5 8]
  [3 6 9]]

 [[1 4 7]
  [2 5 8]
  [3 6 9]]

 [[1 4 7]
  [2 5 8]
  [3 6 9]]]


### 배열 재구조화


* `reshape()`: 배열의 형상을 변경

In [71]:
n1 = np.arange(1, 10)
print(n1)

[1 2 3 4 5 6 7 8 9]


In [72]:
n1.reshape(3,3)

array([[1, 2, 3],
       [4, 5, 6],
       [7, 8, 9]])

* `newaxis()`: 새로운 축 추가

In [73]:
print(n1)
print(n1[np.newaxis, :5])
print(n1[:5, np.newaxis])

[1 2 3 4 5 6 7 8 9]
[[1 2 3 4 5]]
[[1]
 [2]
 [3]
 [4]
 [5]]


### 배열 크기 변경

* 배열 모양만 변경

In [75]:
n2 = np.random.randint(0, 10, (2, 5))
print(n2)
n2.resize((5,2))
n2

[[7 8 7 1 4]
 [9 8 0 5 5]]


array([[7, 8],
       [7, 1],
       [4, 9],
       [8, 0],
       [5, 5]])

* 배열 크기 증가
* 남은 공간은 0으로 채워짐

* 버젼에 따라 달라지는거 같음.
* n2.resize(5,5) 는 에러메세지가 뜸 
* 아래와 같이 실행시 0으로 채워지지 않고 반복으로 채워짐

In [79]:
np.resize(n2, (5, 5))

array([[7, 8, 7, 1, 4],
       [9, 8, 0, 5, 5],
       [7, 8, 7, 1, 4],
       [9, 8, 0, 5, 5],
       [7, 8, 7, 1, 4]])

* 배열 크기 감소
* 포함되지 않은 값은 삭제됨

In [83]:
print(n2)
np.resize(n2, (3,2))

[[7 8]
 [7 1]
 [4 9]
 [8 0]
 [5 5]]


array([[7, 8],
       [7, 1],
       [4, 9]])

### 배열 추가

* `append()`: 배열의 끝에 값 추가

In [84]:
a2 = np.arange(1, 10).reshape(3, 3)
print(a2)

b2 = np.arange(10, 19).reshape(3, 3)
print(b2)

[[1 2 3]
 [4 5 6]
 [7 8 9]]
[[10 11 12]
 [13 14 15]
 [16 17 18]]


* axis 지정이 없으면 1차원 배열 형태로 변형되어 결합

In [86]:
c2 = np.append(a2, b2)
c2

array([ 1,  2,  3,  4,  5,  6,  7,  8,  9, 10, 11, 12, 13, 14, 15, 16, 17,
       18])

* axis를 0으로 지정
* shape[0]을 제외한 나머지 shape은 같아야 함

In [87]:
c2 = np.append(a2, b2, axis=0)
c2

array([[ 1,  2,  3],
       [ 4,  5,  6],
       [ 7,  8,  9],
       [10, 11, 12],
       [13, 14, 15],
       [16, 17, 18]])

* axis를 1로 지정
* shape[1]을 제외한 나머지 shape은 같아야 함

In [88]:
c2 = np.append(a2, b2, axis=1)
c2

array([[ 1,  2,  3, 10, 11, 12],
       [ 4,  5,  6, 13, 14, 15],
       [ 7,  8,  9, 16, 17, 18]])

### 배열 연결

* `concatenate()`: 튜플이나 배열의 리스트를 인수로 사용해 배열 연결

In [89]:
a1 = np.array([1, 3, 5])
b1 = np.array([2, 4, 6])
np.concatenate([a1, b1])

array([1, 3, 5, 2, 4, 6])

In [90]:
c1 = np.array([7, 8, 9])
np.concatenate([a1, b1, c1])

array([1, 3, 5, 2, 4, 6, 7, 8, 9])

In [91]:
a2 = np.array([[1, 2, 3],
               [4, 5, 6]])
np.concatenate([a2, a2])

array([[1, 2, 3],
       [4, 5, 6],
       [1, 2, 3],
       [4, 5, 6]])

In [92]:
a2 = np.array([[1, 2, 3],
               [4, 5, 6]])
np.concatenate([a2, a2], axis=1)

array([[1, 2, 3, 1, 2, 3],
       [4, 5, 6, 4, 5, 6]])

* `vstack()`: 수직 스택(vertical stack), 1차원으로 연결

In [93]:
np.vstack([a2, a2])

array([[1, 2, 3],
       [4, 5, 6],
       [1, 2, 3],
       [4, 5, 6]])

* `hstack()`: 수평 스택(horizontal stack), 2차원으로 연결

In [94]:
np.hstack([a2, a2])

array([[1, 2, 3, 1, 2, 3],
       [4, 5, 6, 4, 5, 6]])

* `dstack()`: 깊이 스택(depth stack), 3차원으로 연결

In [95]:
np.dstack([a2, a2])

array([[[1, 1],
        [2, 2],
        [3, 3]],

       [[4, 4],
        [5, 5],
        [6, 6]]])

* `stack()`: 새로운 차원으로 연결

In [96]:
np.stack([a2, a2])

array([[[1, 2, 3],
        [4, 5, 6]],

       [[1, 2, 3],
        [4, 5, 6]]])

### 배열 분할

* `split()`: 배열 분할

In [99]:
a1 = np.arange(0, 10)
print(a1)
b1, c1 = np.split(a1, [5])
print(b1, c1)
b1, c1, d1, e1, f1 = np.split(a1, [2, 4, 6, 8])
print(b1, c1, d1, e1, f1)

[0 1 2 3 4 5 6 7 8 9]
[0 1 2 3 4] [5 6 7 8 9]
[0 1] [2 3] [4 5] [6 7] [8 9]


* `vsplit()`: 수직 분할, 1차원으로 분할

In [101]:
a2 = np.arange(1, 10).reshape(3,3)
print(a2)
b2, c2 = np.vsplit(a2, [2])
print(b2)
print(c2)

[[1 2 3]
 [4 5 6]
 [7 8 9]]
[[1 2 3]
 [4 5 6]]
[[7 8 9]]


* `hsplit()`: 수평 분할, 2차원으로 분할

In [102]:
a2 = np.arange(1, 10).reshape(3,3)
print(a2)
b2, c2 = np.hsplit(a2, [2])
print(b2)
print(c2)

[[1 2 3]
 [4 5 6]
 [7 8 9]]
[[1 2]
 [4 5]
 [7 8]]
[[3]
 [6]
 [9]]


* `dsplit()`: 깊이 분할, 3차원으로 분할

In [105]:
a3 = np.arange(1, 28).reshape(3,3,3)
print(a3)
b3, c3 = np.dsplit(a3, [2])
print(b3)
print(c3)

[[[ 1  2  3]
  [ 4  5  6]
  [ 7  8  9]]

 [[10 11 12]
  [13 14 15]
  [16 17 18]]

 [[19 20 21]
  [22 23 24]
  [25 26 27]]]
[[[ 1  2]
  [ 4  5]
  [ 7  8]]

 [[10 11]
  [13 14]
  [16 17]]

 [[19 20]
  [22 23]
  [25 26]]]
[[[ 3]
  [ 6]
  [ 9]]

 [[12]
  [15]
  [18]]

 [[21]
  [24]
  [27]]]




---



## 배열 연산

* NumPy의 배열 연산은 벡터화(vectorized) 연산을 사용
* 일반적으로 NumPy의 범용 함수(universal functions)를 통해 구현
* 배열 요소에 대한 반복적인 계산을 효율적으로 수행

### 브로드캐스팅(Broadcasting)

![image.png](attachment:image.png)

![image.png](attachment:image.png)

In [106]:
a1 = np.array([1, 2, 3])
print(a1)
a1 + 5

[1 2 3]


array([6, 7, 8])

In [107]:
a2 = np.arange(1, 10).reshape(3, 3)
a1 + a2

array([[ 2,  4,  6],
       [ 5,  7,  9],
       [ 8, 10, 12]])

In [108]:
a3 = a1.reshape(3, 1)
a1 + a3 

array([[2, 3, 4],
       [3, 4, 5],
       [4, 5, 6]])

### 산술 연산(Arithmetic Operators)

![image.png](attachment:image.png)

In [112]:
a1 = np.arange(1, 10)
print(a1)
print(a1 + 1)
print(np.add(a1,10))
print(a1 - 2)
print(np.subtract(a1, 10))
print(-a1)
print(np.negative(a1))
print(a1 * 2)
print(np.multiply(a1, 2))
print(a1 / 2)
print(np.divide(a1, 2))
print(a1 // 2)
print(np.floor_divide(a1, 2))
print(a1 ** 2)
print(np.power(a1, 2))
print(a1 % 2)
print(np.mod(a1, 2))

[1 2 3 4 5 6 7 8 9]
[ 2  3  4  5  6  7  8  9 10]
[11 12 13 14 15 16 17 18 19]
[-1  0  1  2  3  4  5  6  7]
[-9 -8 -7 -6 -5 -4 -3 -2 -1]
[-1 -2 -3 -4 -5 -6 -7 -8 -9]
[-1 -2 -3 -4 -5 -6 -7 -8 -9]
[ 2  4  6  8 10 12 14 16 18]
[ 2  4  6  8 10 12 14 16 18]
[0.5 1.  1.5 2.  2.5 3.  3.5 4.  4.5]
[0.5 1.  1.5 2.  2.5 3.  3.5 4.  4.5]
[0 1 1 2 2 3 3 4 4]
[0 1 1 2 2 3 3 4 4]
[ 1  4  9 16 25 36 49 64 81]
[ 1  4  9 16 25 36 49 64 81]
[1 0 1 0 1 0 1 0 1]
[1 0 1 0 1 0 1 0 1]


In [114]:
a1 = np.arange(1, 10)
print(a1)
b1 = np.random.randint(1, 10, size=9)
print(b1)
print(a1 + b1)
print(a1 - b1)
print(a1 * b1)
print(a1 / b1)
print(a1 // b1)
print(a1 ** b1)
print(a1 % b1)

[1 2 3 4 5 6 7 8 9]
[5 4 8 7 6 5 5 1 7]
[ 6  6 11 11 11 11 12  9 16]
[-4 -2 -5 -3 -1  1  2  7  2]
[ 5  8 24 28 30 30 35  8 63]
[0.2        0.5        0.375      0.57142857 0.83333333 1.2
 1.4        8.         1.28571429]
[0 0 0 0 0 1 1 8 1]
[      1      16    6561   16384   15625    7776   16807       8 4782969]
[1 2 3 4 5 1 2 0 2]


In [115]:
a1 = np.arange(1, 10).reshape(3, 3)
print(a1)
b1 = np.random.randint(1, 10, size=(3, 3))
print(b1)
print(a1 + b1)
print(a1 - b1)
print(a1 * b1)
print(a1 / b1)
print(a1 // b1)
print(a1 ** b1)
print(a1 % b1)

[[1 2 3]
 [4 5 6]
 [7 8 9]]
[[4 2 4]
 [3 6 4]
 [2 5 9]]
[[ 5  4  7]
 [ 7 11 10]
 [ 9 13 18]]
[[-3  0 -1]
 [ 1 -1  2]
 [ 5  3  0]]
[[ 4  4 12]
 [12 30 24]
 [14 40 81]]
[[0.25       1.         0.75      ]
 [1.33333333 0.83333333 1.5       ]
 [3.5        1.6        1.        ]]
[[0 1 0]
 [1 0 1]
 [3 1 1]]
[[        1         4        81]
 [       64     15625      1296]
 [       49     32768 387420489]]
[[1 0 3]
 [1 5 2]
 [1 3 0]]


#### 절대값 함수(Absolute Function)

* `absolute()`, `abs()`: 내장된 절대값 함수

In [118]:
a1 = np.random.randint(-10 , 10 , size=5)
print(a1)
print(np.absolute(a1))
print(np.abs(a1))

[-4 -5  9  8  2]
[4 5 9 8 2]
[4 5 9 8 2]


#### 제곱/제곱근 함수

* `square`, `sqrt`: 제곱, 제곱근 함수

In [120]:
print(a1)
print(np.square(a1))
print(np.sqrt(a1))

[-4 -5  9  8  2]
[16 25 81 64  4]
[       nan        nan 3.         2.82842712 1.41421356]


  print(np.sqrt(a1))


#### 지수와 로그 함수 (Exponential and Log Function)

In [121]:
a1 = np.random.randint(1, 10, size=5)
print(a1)
print(np.exp(a1))

print(np.exp2(a1))
print(np.power(a1, 2))

[1 3 4 5 1]
[  2.71828183  20.08553692  54.59815003 148.4131591    2.71828183]
[ 2.  8. 16. 32.  2.]
[ 1  9 16 25  1]


In [122]:
print(a1)
print(np.log(a1))
print(np.log2(a1))
print(np.log10(a1))

[1 3 4 5 1]
[0.         1.09861229 1.38629436 1.60943791 0.        ]
[0.         1.5849625  2.         2.32192809 0.        ]
[0.         0.47712125 0.60205999 0.69897    0.        ]


#### 삼각 함수(Trigonometrical Function)


![image.png](attachment:image.png)

In [123]:
t = np.linspace(0, np.pi, 3)
print(t)
print(np.sin(t))
print(np.cos(t))
print(np.tan(t))

[0.         1.57079633 3.14159265]
[0.0000000e+00 1.0000000e+00 1.2246468e-16]
[ 1.000000e+00  6.123234e-17 -1.000000e+00]
[ 0.00000000e+00  1.63312394e+16 -1.22464680e-16]


In [124]:
x = [-1, 0, 1]
print(x)
print(np.arcsin(x))
print(np.arccos(x))
print(np.arctan(x))

[-1, 0, 1]
[-1.57079633  0.          1.57079633]
[3.14159265 1.57079633 0.        ]
[-0.78539816  0.          0.78539816]


### 집계 함수(Aggregate Functions)

![image.png](attachment:image.png)

![image.png](attachment:image.png)

#### sum(): 합 계산

In [126]:
a2 = np.random.randint(1, 10, size=(3, 3))
print(a2)
print(a2.sum(), np.sum(a2))
print(a2.sum(axis=0), np.sum(a2, axis=0))
print(a2.sum(axis=1), np.sum(a2, axis=1))

[[1 3 8]
 [2 1 8]
 [2 9 6]]
40 40
[ 5 13 22] [ 5 13 22]
[12 11 17] [12 11 17]


#### cumsum(): 누적합 계산

In [127]:
print(a2)
print( np.cumsum(a2))
print( np.cumsum(a2, axis=0))
print( np.cumsum(a2, axis=1))

[[1 3 8]
 [2 1 8]
 [2 9 6]]
[ 1  4 12 14 15 23 25 34 40]
[[ 1  3  8]
 [ 3  4 16]
 [ 5 13 22]]
[[ 1  4 12]
 [ 2  3 11]
 [ 2 11 17]]


#### diff(): 차분 계산

In [128]:
print(a2)
print( np.diff(a2))
print( np.diff(a2, axis=0))
print( np.diff(a2, axis=1))

[[1 3 8]
 [2 1 8]
 [2 9 6]]
[[ 2  5]
 [-1  7]
 [ 7 -3]]
[[ 1 -2  0]
 [ 0  8 -2]]
[[ 2  5]
 [-1  7]
 [ 7 -3]]


#### prod(): 곱 계산

In [129]:
print(a2)
print( np.prod(a2))
print( np.prod(a2, axis=0))
print( np.prod(a2, axis=1))

[[1 3 8]
 [2 1 8]
 [2 9 6]]
41472
[  4  27 384]
[ 24  16 108]


#### cumprod(): 누적곱 계산

In [130]:
print(a2)
print( np.cumprod(a2))
print( np.cumprod(a2, axis=0))
print( np.cumprod(a2, axis=1))

[[1 3 8]
 [2 1 8]
 [2 9 6]]
[    1     3    24    48    48   384   768  6912 41472]
[[  1   3   8]
 [  2   3  64]
 [  4  27 384]]
[[  1   3  24]
 [  2   2  16]
 [  2  18 108]]


#### dot()/matmul(): 점곱/행렬곱 계산

In [131]:
print(a2)
b2 = np.ones_like(a2)
print(b2)

print(np.dot(a2, b2))
print(np.matmul(a2, b2))

[[1 3 8]
 [2 1 8]
 [2 9 6]]
[[1 1 1]
 [1 1 1]
 [1 1 1]]
[[12 12 12]
 [11 11 11]
 [17 17 17]]
[[12 12 12]
 [11 11 11]
 [17 17 17]]


#### tensordot(): 텐서곱 계산

In [138]:
print(a2)
print(b2)
print('axes=default')
print(np.tensordot(a2, b2))
print()
print('axes=0')
print(np.tensordot(a2, b2, axes=0))
print()
print('axes=1')
print(np.tensordot(a2, b2, axes=1))

[[1 3 8]
 [2 1 8]
 [2 9 6]]
[[1 1 1]
 [1 1 1]
 [1 1 1]]
axes=default
40

axes=0
[[[[1 1 1]
   [1 1 1]
   [1 1 1]]

  [[3 3 3]
   [3 3 3]
   [3 3 3]]

  [[8 8 8]
   [8 8 8]
   [8 8 8]]]


 [[[2 2 2]
   [2 2 2]
   [2 2 2]]

  [[1 1 1]
   [1 1 1]
   [1 1 1]]

  [[8 8 8]
   [8 8 8]
   [8 8 8]]]


 [[[2 2 2]
   [2 2 2]
   [2 2 2]]

  [[9 9 9]
   [9 9 9]
   [9 9 9]]

  [[6 6 6]
   [6 6 6]
   [6 6 6]]]]

axes=1
[[12 12 12]
 [11 11 11]
 [17 17 17]]


#### cross(): 벡터곱

In [None]:
x = [1, 2, 3]
y = [4, 5, 6]
print(np.cross(x, y))

#### inner()/outer(): 내적/외적

In [139]:
print(a2)
print(b2)
print(np.inner(a2, b2))
print(np.outer(a2, b2))

[[1 3 8]
 [2 1 8]
 [2 9 6]]
[[1 1 1]
 [1 1 1]
 [1 1 1]]
[[12 12 12]
 [11 11 11]
 [17 17 17]]
[[1 1 1 1 1 1 1 1 1]
 [3 3 3 3 3 3 3 3 3]
 [8 8 8 8 8 8 8 8 8]
 [2 2 2 2 2 2 2 2 2]
 [1 1 1 1 1 1 1 1 1]
 [8 8 8 8 8 8 8 8 8]
 [2 2 2 2 2 2 2 2 2]
 [9 9 9 9 9 9 9 9 9]
 [6 6 6 6 6 6 6 6 6]]


#### mean(): 평균 계산

In [140]:
print(a2)
print(np.mean(a2))
print(np.mean(a2, axis=0))
print(np.mean(a2, axis=1))

[[1 3 8]
 [2 1 8]
 [2 9 6]]
4.444444444444445
[1.66666667 4.33333333 7.33333333]
[4.         3.66666667 5.66666667]


#### std(): 표준 편차 계산

In [141]:
print(a2)
print(np.std(a2))
print(np.std(a2, axis=0))
print(np.std(a2, axis=1))

[[1 3 8]
 [2 1 8]
 [2 9 6]]
3.095197394929804
[0.47140452 3.39934634 0.94280904]
[2.94392029 3.09120617 2.86744176]


#### var(): 분산 계산

In [142]:
print(a2)
print(np.var(a2))
print(np.var(a2, axis=0))
print(np.var(a2, axis=1))

[[1 3 8]
 [2 1 8]
 [2 9 6]]
9.580246913580247
[ 0.22222222 11.55555556  0.88888889]
[8.66666667 9.55555556 8.22222222]


#### min(): 최소값

In [143]:
print(a2)
print(np.min(a2))
print(np.min(a2, axis=0))
print(np.min(a2, axis=1))

[[1 3 8]
 [2 1 8]
 [2 9 6]]
1
[1 1 6]
[1 1 2]


#### max(): 최대값

In [144]:
print(a2)
print(np.max(a2))
print(np.max(a2, axis=0))
print(np.max(a2, axis=1))

[[1 3 8]
 [2 1 8]
 [2 9 6]]
9
[2 9 8]
[8 8 9]


#### argmin(): 최소값 인덱스

In [146]:
print(a2)
print(np.argmin(a2))
print(np.argmin(a2, axis=0))
print(np.argmin(a2, axis=1))

[[1 3 8]
 [2 1 8]
 [2 9 6]]
0
[0 1 2]
[0 1 0]


#### argmax(): 최대값 인덱스

In [145]:
print(a2)
print(np.argmax(a2))
print(np.argmax(a2, axis=0))
print(np.argmax(a2, axis=1))

[[1 3 8]
 [2 1 8]
 [2 9 6]]
7
[1 2 0]
[2 2 1]


#### median(): 중앙값

In [147]:
print(a2)
print(np.median(a2))
print(np.median(a2, axis=0))
print(np.median(a2, axis=1))

[[1 3 8]
 [2 1 8]
 [2 9 6]]
3.0
[2. 3. 8.]
[3. 2. 6.]


#### percentile(): 백분위 수



![image.png](attachment:image.png)

In [149]:
a1 = np.array([0, 1, 2, 3])
print(a1)
print(np.percentile(a1, [0, 20, 40, 60, 80, 100], interpolation='linear'))
print(np.percentile(a1, [0, 20, 40, 60, 80, 100], interpolation='higher'))
print(np.percentile(a1, [0, 20, 40, 60, 80, 100], interpolation='lower'))
print(np.percentile(a1, [0, 20, 40, 60, 80, 100], interpolation='nearest'))
print(np.percentile(a1, [0, 20, 40, 60, 80, 100], interpolation='midpoint'))

[0 1 2 3]
[0.  0.6 1.2 1.8 2.4 3. ]
[0 1 2 2 3 3]
[0 0 1 1 2 3]
[0 1 1 2 2 3]
[0.  0.5 1.5 1.5 2.5 3. ]


#### any()

In [155]:
a2 = np.array([[False, False, True],
               [True, True, True],
               [False, True, True]])

print(a2)

print(np.any(a2))
print(np.any(a2, axis=0))
print(np.any(a2, axis=1))

[[False False  True]
 [ True  True  True]
 [False  True  True]]
True
[ True  True  True]
[ True  True  True]


#### all()

In [156]:
print(a2)

print(np.all(a2))
print(np.all(a2, axis=0))
print(np.all(a2, axis=1))

[[False False  True]
 [ True  True  True]
 [False  True  True]]
False
[False False  True]
[False  True False]


### 비교 연산(Comparison Operators)


![image.png](attachment:image.png)

In [159]:
a1 = np.arange(1, 10)
print(a1)

print(a1 == 5)
print(a1 != 3)
print(a1 < 5)
print(a1 <= 5)
print(a1 > 5)
print(a1 >= 5)

[1 2 3 4 5 6 7 8 9]
[False False False False  True False False False False]
[ True  True False  True  True  True  True  True  True]
[ True  True  True  True False False False False False]
[ True  True  True  True  True False False False False]
[False False False False False  True  True  True  True]
[False False False False  True  True  True  True  True]


In [161]:
a2 = np.arange(1, 10).reshape(3, 3)
print(a2)
print(np.sum(a2))
print(np.count_nonzero(a2 > 5))
print(np.sum(a2 > 5))
print(np.sum(a2 > 5, axis=0))
print(np.sum(a2 > 5, axis=1))
print(np.any(a2 > 5))
print(np.any(a2 > 5, axis=0))
print(np.any(a2 > 5, axis=1))
print(np.all(a2 > 5))
print(np.all(a2 > 5, axis=0))
print(np.all(a2 > 5, axis=1))

[[1 2 3]
 [4 5 6]
 [7 8 9]]
45
4
4
[1 1 2]
[0 1 3]
True
[ True  True  True]
[False  True  True]
False
[False False False]
[False False  True]


![image.png](attachment:image.png)

In [162]:
a1 = np.array([1, 2, 3, 4, 5])
print(a1)
b1 = np.array([1, 2, 3, 3, 4])
print(b1)
print(np.isclose(a1, b1))


[1 2 3 4 5]
[1 2 3 3 4]
[ True  True  True False False]


In [165]:
a1 = np.array([np.nan, 2, np.inf, 4, np.NINF])
print(a1)
print(np.isnan(a1))
print(np.isinf(a1))
print(np.isfinite(a1))

[ nan   2.  inf   4. -inf]
[ True False False False False]
[False False  True False  True]
[False  True False  True False]


#### 불리언 연산자(Boolean Operators)


![image.png](attachment:image.png)

In [168]:
a2 = np.arange(1, 10).reshape(3, 3)
print(a2)

print((a2 > 5) & (a2 < 8))
print(a2[(a2 > 5) & (a2 < 8)]) # 불리언 인덱싱

print((a2 > 5) | (a2 < 8))
print(a2[(a2 > 5) | (a2 < 8)])

print((a2 > 5) ^ (a2 < 8))
print(a2[(a2 > 5) ^ (a2 < 8)])

print(~(a2 > 5) )
print(a2[~(a2 > 5)])


[[1 2 3]
 [4 5 6]
 [7 8 9]]
[[False False False]
 [False False  True]
 [ True False False]]
[6 7]
[[ True  True  True]
 [ True  True  True]
 [ True  True  True]]
[1 2 3 4 5 6 7 8 9]
[[ True  True  True]
 [ True  True False]
 [False  True  True]]
[1 2 3 4 5 8 9]
[[ True  True  True]
 [ True  True False]
 [False False False]]
[1 2 3 4 5]


### 배열 정렬

In [170]:
a1 = np.random.randint(1, 10, size=10)
print(a1)
print(np.sort(a1))
print(a1)
print(np.argsort(a1))
print(a1)
a1.sort()
print(a1)

[8 6 7 5 2 6 5 9 4 9]
[2 4 5 5 6 6 7 8 9 9]
[8 6 7 5 2 6 5 9 4 9]
[4 8 3 6 1 5 2 0 7 9]
[8 6 7 5 2 6 5 9 4 9]
[2 4 5 5 6 6 7 8 9 9]


In [171]:
a2 = np.random.randint(1, 10, size=(3, 3))
print(a2)
print(np.sort(a2, axis=0))
print(np.sort(a2, axis=1))

[[4 4 8]
 [7 4 8]
 [3 2 7]]
[[3 2 7]
 [4 4 8]
 [7 4 8]]
[[4 4 8]
 [4 7 8]
 [2 3 7]]


#### 부분 정렬

* `partition()`: 배열에서 k개의 작은 값을 반환

In [173]:
a1 = np.random.randint(1, 10, size=10)
print(a1)
print(np.partition(a1, 3))

[1 8 3 3 1 2 1 9 5 5]
[1 1 1 2 3 3 8 9 5 5]


In [175]:
a2 = np.random.randint(1, 10, size=(5, 5))
print(a2)
print(np.partition(a2, 3))
print(np.partition(a2, 3, axis=0))
print(np.partition(a2, 3, axis=1))


[[2 6 6 8 9]
 [6 4 2 2 4]
 [8 7 7 7 4]
 [1 6 3 9 2]
 [2 8 8 4 2]]
[[2 6 6 8 9]
 [2 2 4 4 6]
 [7 4 7 7 8]
 [1 2 3 6 9]
 [2 2 4 8 8]]
[[1 6 3 2 2]
 [2 6 6 4 2]
 [2 4 2 7 4]
 [6 7 7 8 4]
 [8 8 8 9 9]]
[[2 6 6 8 9]
 [2 2 4 4 6]
 [7 4 7 7 8]
 [1 2 3 6 9]
 [2 2 4 8 8]]


## 배열 입출력


![image.png](attachment:image.png)

In [176]:
a2 = np.random.randint(1, 10, size=(5, 5))
print(a2)
np.save('a', a2)

[[8 8 8 4 8]
 [5 8 4 4 3]
 [2 1 4 1 9]
 [4 8 6 6 9]
 [4 6 3 6 2]]


In [178]:
# COLAB
# !ls 

# Local
import os
os.listdir()

['.ipynb_checkpoints', 'a.npy', 'L00_Numpy.ipynb']

In [179]:
b2 = np.random.randint(1, 10, size=(5, 5))
print(b2)
np.savez("ab", a2, b2)


[[5 3 6 3 9]
 [3 3 5 5 6]
 [3 5 6 2 4]
 [8 4 9 7 7]
 [6 9 8 1 2]]


In [180]:
# COLAB
# !ls 

# Local
import os
os.listdir()

['.ipynb_checkpoints', 'a.npy', 'ab.npz', 'L00_Numpy.ipynb']

In [182]:
npy = np.load('a.npy')
npy

array([[8, 8, 8, 4, 8],
       [5, 8, 4, 4, 3],
       [2, 1, 4, 1, 9],
       [4, 8, 6, 6, 9],
       [4, 6, 3, 6, 2]])

In [187]:
npz = np.load('ab.npz')
print(npz.files)

['arr_0', 'arr_1']


In [189]:
npz['arr_0']

array([[8, 8, 8, 4, 8],
       [5, 8, 4, 4, 3],
       [2, 1, 4, 1, 9],
       [4, 8, 6, 6, 9],
       [4, 6, 3, 6, 2]])

In [190]:
print(a2)
np.savetxt("a.csv", a2, delimiter=',') # csv 파일이니까 , 로 설정

[[8 8 8 4 8]
 [5 8 4 4 3]
 [2 1 4 1 9]
 [4 8 6 6 9]
 [4 6 3 6 2]]


In [191]:
# COLAB
# !ls 

# Local
import os
os.listdir()

['.ipynb_checkpoints', 'a.csv', 'a.npy', 'ab.npz', 'L00_Numpy.ipynb']

In [195]:
f = open("a.csv", 'r')
for i in f:
    print(i)
f.close()

8.000000000000000000e+00,8.000000000000000000e+00,8.000000000000000000e+00,4.000000000000000000e+00,8.000000000000000000e+00

5.000000000000000000e+00,8.000000000000000000e+00,4.000000000000000000e+00,4.000000000000000000e+00,3.000000000000000000e+00

2.000000000000000000e+00,1.000000000000000000e+00,4.000000000000000000e+00,1.000000000000000000e+00,9.000000000000000000e+00

4.000000000000000000e+00,8.000000000000000000e+00,6.000000000000000000e+00,6.000000000000000000e+00,9.000000000000000000e+00

4.000000000000000000e+00,6.000000000000000000e+00,3.000000000000000000e+00,6.000000000000000000e+00,2.000000000000000000e+00



In [196]:
csv = np.loadtxt('a.csv', delimiter=',')
csv

array([[8., 8., 8., 4., 8.],
       [5., 8., 4., 4., 3.],
       [2., 1., 4., 1., 9.],
       [4., 8., 6., 6., 9.],
       [4., 6., 3., 6., 2.]])

In [198]:
print(b2)
np.savetxt("b.csv", b2, delimiter=',', fmt='%.2e', header='c1, c2, c3, c4, c5') # fmt 소숫점 자릿수,

[[5 3 6 3 9]
 [3 3 5 5 6]
 [3 5 6 2 4]
 [8 4 9 7 7]
 [6 9 8 1 2]]


In [199]:
f = open("b.csv", 'r')
for i in f:
    print(i)
f.close()

# c1, c2, c3, c4, c5

5.00e+00,3.00e+00,6.00e+00,3.00e+00,9.00e+00

3.00e+00,3.00e+00,5.00e+00,5.00e+00,6.00e+00

3.00e+00,5.00e+00,6.00e+00,2.00e+00,4.00e+00

8.00e+00,4.00e+00,9.00e+00,7.00e+00,7.00e+00

6.00e+00,9.00e+00,8.00e+00,1.00e+00,2.00e+00



In [200]:
csv = np.loadtxt('b.csv', delimiter=',')
print(csv)

[[5. 3. 6. 3. 9.]
 [3. 3. 5. 5. 6.]
 [3. 5. 6. 2. 4.]
 [8. 4. 9. 7. 7.]
 [6. 9. 8. 1. 2.]]




---

