# NumPy 한번에 제대로 배우기
https://www.youtube.com/watch?v=mirZPrWwvao&list=PL7ZVZgsnLwEEZcVusN-fV_sJhQHq833OS&index=10  
업데이트 되는 내용은 https://numpy.org 를 통해서 봐야된다



---



## NumPy 특징

* Numerical Python의 약자
* 고성능 과학 계산용 패키지로 강력한 N차원 배열 객체
* 범용적 데이터 처리에 사용 가능한 다차원 컨테이너
* 정교한 브로드캐스팅(broadcasting) 기능
* 파이썬의 자료형 list와 비슷하지만, 더 빠르고 메모리를 효율적으로 관리
* 반복문 없이 데이터 배열에 대한 처리를 지원하여 빠르고 편리
* 데이터 과학 도구에 대한 생태계의 핵심을 이루고 있음

In [4]:
import numpy as np
np.__version__

'1.22.3'



---



## 배열 생성

### 리스트로 배열 만들기


In [5]:
# 1차원
a1 = np.array([1, 2, 3, 4, 5])
print(a1)
print(type(a1))
print(a1.shape) # 1차원 배열
print(a1[0], a1[1])
a1[1] = 4 # 값을 수정할 수도 있다
a1[2] = 6
print(a1)

[1 2 3 4 5]
<class 'numpy.ndarray'>
(5,)
1 2
[1 4 6 4 5]


In [6]:
# 2차원
a2 = np.array([[1,2,3], [4,5,6], [7,8,9]])
print(a2)
print(a2.shape)
print(a2[0,0], a2[1,1], a2[2,2])

[[1 2 3]
 [4 5 6]
 [7 8 9]]
(3, 3)
1 5 9


In [7]:
# 3차원
a3 = np.array([[[1,2,3], [4,5,6], [7,8,9]],
             [[1,2,3], [4,5,6], [7,8,9]],
             [[1,2,3], [4,5,6], [7,8,9]]])
print(a3)
print(a3.shape)

[[[1 2 3]
  [4 5 6]
  [7 8 9]]

 [[1 2 3]
  [4 5 6]
  [7 8 9]]

 [[1 2 3]
  [4 5 6]
  [7 8 9]]]
(3, 3, 3)


### 배열 생성 및 초기화

* `zeros()`: 모든 요소를 0으로 초기화

In [8]:
np.zeros(10)

array([0., 0., 0., 0., 0., 0., 0., 0., 0., 0.])

* `ones()`: 모든 요소를 1로 초기화

In [9]:
np.ones(10)

array([1., 1., 1., 1., 1., 1., 1., 1., 1., 1.])

In [10]:
np.ones((3,3))

array([[1., 1., 1.],
       [1., 1., 1.],
       [1., 1., 1.]])

* `full()`: 모든 요소를 지정한 값으로 초기화

In [11]:
np.full((3,3), 'any value')

array([['any value', 'any value', 'any value'],
       ['any value', 'any value', 'any value'],
       ['any value', 'any value', 'any value']], dtype='<U9')

* `eye()`: 단위행렬(identity matrix) 생성
  + 주대각선의 원소가 모두 1이고 나머지 원소는 모두 0인 정사각 행렬

In [12]:
np.eye(3) # n만 주면 된다

array([[1., 0., 0.],
       [0., 1., 0.],
       [0., 0., 1.]])

* `tri()`: 삼각행렬 생성

In [13]:
np.tri(3)

array([[1., 0., 0.],
       [1., 1., 0.],
       [1., 1., 1.]])

* `empty()`: 초기화되지 않은 배열 생성
  + 초기화가 없어서 배열 생성비용 저렴하고 빠름
  + 초기화되지 않아서 기존 메모리 위치에 존재하는 값이 있음

In [14]:
np.empty(10) 

array([1., 1., 1., 1., 1., 1., 1., 1., 1., 1.])

* `_like()`: 지정된 배열과 shape가 같은 행렬 생성
  + `np.zeros_like()`
  + `np.ones_like()`
  + `np.full_like()`
  + `np.empty_like()`

In [15]:
print(a1)
np.zeros_like(a1) # a1과 같은 shape의 zeros()

[1 4 6 4 5]


array([0, 0, 0, 0, 0])

In [16]:
print(a2)
np.ones_like(a2)

[[1 2 3]
 [4 5 6]
 [7 8 9]]


array([[1, 1, 1],
       [1, 1, 1],
       [1, 1, 1]])

In [17]:
print(a3)
np.full_like(a3, 10)

[[[1 2 3]
  [4 5 6]
  [7 8 9]]

 [[1 2 3]
  [4 5 6]
  [7 8 9]]

 [[1 2 3]
  [4 5 6]
  [7 8 9]]]


array([[[10, 10, 10],
        [10, 10, 10],
        [10, 10, 10]],

       [[10, 10, 10],
        [10, 10, 10],
        [10, 10, 10]],

       [[10, 10, 10],
        [10, 10, 10],
        [10, 10, 10]]])

### 생성한 값으로 배열 생성

* `arange()`: 정수 범위로 배열 생성

In [18]:
np.arange(0, 30, 2)

array([ 0,  2,  4,  6,  8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28])

* `linspace()`: 범위 내에서 균등 간격의 배열 생성

In [19]:
np.linspace(0, 1, 5)

array([0.  , 0.25, 0.5 , 0.75, 1.  ])

* `logspace()`: 범위 내에서 균등간격으로 로그 스케일로 배열 생성

In [20]:
np.logspace(0.1, 1, 20)

array([ 1.25892541,  1.40400425,  1.565802  ,  1.74624535,  1.94748304,
        2.1719114 ,  2.42220294,  2.70133812,  3.0126409 ,  3.35981829,
        3.74700446,  4.17881006,  4.66037703,  5.19743987,  5.79639395,
        6.46437163,  7.2093272 ,  8.04013161,  8.9666781 , 10.        ])

### 랜덤값으로 배열 생성
![image.png](attachment:image.png)

* `random.random()`: 랜덤한 수의 배열 생성

In [21]:
np.random.random((3,3))

array([[0.20952892, 0.34342582, 0.46629091],
       [0.35159246, 0.65433784, 0.95280275],
       [0.91423154, 0.75267397, 0.87552964]])

* `random.randint()`: 일정 구간의 랜덤 정수의 배열 생성

In [22]:
np.random.randint(0,10, (3,3))

array([[8, 7, 3],
       [4, 0, 8],
       [8, 8, 7]])

* `random.normal()`: 정규분포(normal distribution)를 고려한 랜덤한 수의 배열 생성
* 평균=0, 표준편차=1, 3 x 3 배열

In [23]:
np.random.normal(0, 1, (3,3))

array([[ 0.22638912, -0.32870637, -1.46551629],
       [-0.64214411, -0.1238095 ,  0.56451652],
       [ 0.01172573,  0.51016487, -1.57263386]])

* `random.rand()`: 균등분포(uniform distribution)를 고려한 랜덤한 수의 배열 생성

In [24]:
np.random.rand(3,3)

array([[0.06771499, 0.94424237, 0.87570567],
       [0.37644617, 0.86002389, 0.99039723],
       [0.95764998, 0.27856699, 0.50404866]])

* `random.randn()`: 표준 정규 분포(standard normal distribution)를 고려한 랜덤한 수의 배열 생성

In [25]:
np.random.randn(3,3)

array([[ 1.39441283,  0.15319852, -0.26589218],
       [ 0.61129737,  0.27041458, -1.05751992],
       [-2.03030675, -1.16018263, -0.04326708]])

### 표준 데이터 타입
![image.png](attachment:image.png)

In [26]:
np.zeros(20, dtype=int)

array([0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0])

In [27]:
np.ones((3, 3), dtype=bool)

array([[ True,  True,  True],
       [ True,  True,  True],
       [ True,  True,  True]])

In [28]:
np.full((3, 3), 1.0, dtype=float)

array([[1., 1., 1.],
       [1., 1., 1.],
       [1., 1., 1.]])

### 날짜/시간 배열 생성
![image.png](attachment:image.png)

In [29]:
date = np.array('2020-01-01', dtype=np.datetime64)
date

array('2020-01-01', dtype='datetime64[D]')

In [30]:
date + np.arange(12) # 기존 날짜에 추가되는 형태

array(['2020-01-01', '2020-01-02', '2020-01-03', '2020-01-04',
       '2020-01-05', '2020-01-06', '2020-01-07', '2020-01-08',
       '2020-01-09', '2020-01-10', '2020-01-11', '2020-01-12'],
      dtype='datetime64[D]')

In [31]:
datetime = np.datetime64('2020-06-01 12:00')
datetime

numpy.datetime64('2020-06-01T12:00')

In [32]:
datetime = np.datetime64('2020-06-01 12:00:12.34', 'ns')
datetime

numpy.datetime64('2020-06-01T12:00:12.340000000')



---



## 배열 조회

### 배열 속성 정보

In [33]:
def array_info(array):
    print (array)
    print ("ndim:", array.ndim)
    print ("shape:", array.shape)
    print("dtype:", array.dtype)
    print("size:", array.size)
    print ("itemsize:", array.itemsize)
    print("nbytes:", array.nbytes)
    print ("strides:", array.strides)

In [34]:
array_info(a1)

[1 4 6 4 5]
ndim: 1
shape: (5,)
dtype: int64
size: 5
itemsize: 8
nbytes: 40
strides: (8,)


In [35]:
array_info(a2)

[[1 2 3]
 [4 5 6]
 [7 8 9]]
ndim: 2
shape: (3, 3)
dtype: int64
size: 9
itemsize: 8
nbytes: 72
strides: (24, 8)


In [36]:
array_info(a3)

[[[1 2 3]
  [4 5 6]
  [7 8 9]]

 [[1 2 3]
  [4 5 6]
  [7 8 9]]

 [[1 2 3]
  [4 5 6]
  [7 8 9]]]
ndim: 3
shape: (3, 3, 3)
dtype: int64
size: 27
itemsize: 8
nbytes: 216
strides: (72, 24, 8)


### 인덱싱(Indexing)

In [37]:
print(a1)
print(a1[0])
print(a1[2])
print(a1[-1])

[1 4 6 4 5]
1
6
5


In [38]:
print(a2)
print(a2[0, 0])
print(a2[0, 2])
print(a2[1, 1])
print(a2[2,-1])

[[1 2 3]
 [4 5 6]
 [7 8 9]]
1
3
5
9


In [39]:
print(a3)
print(a3[0, 0, 0])
print(a3[1, 1, 1])
print(a3[2, 2, 2])
print(a3[2,-1,-1])

[[[1 2 3]
  [4 5 6]
  [7 8 9]]

 [[1 2 3]
  [4 5 6]
  [7 8 9]]

 [[1 2 3]
  [4 5 6]
  [7 8 9]]]
1
5
9
9


### 슬라이싱(Slicing)

* 슬라이싱 구문: `a[start:stop:step]`
* 기본값: start=0, stop=ndim, step=1

In [40]:
a1 = np.array([1,2,3,4,5])
print(a1)
print(a1[0:2])
print(a1[0:])
print(a1[:1])
print(a1[::2])
print(a1[::-1])

[1 2 3 4 5]
[1 2]
[1 2 3 4 5]
[1]
[1 3 5]
[5 4 3 2 1]


In [41]:
print(a2)
print(a2[1])
print (a2[1, :])
print(a2[:2, :2])
print(a2[1:, ::-1])
print (a2[::-1, ::-1]) # 스텝을 -1

[[1 2 3]
 [4 5 6]
 [7 8 9]]
[4 5 6]
[4 5 6]
[[1 2]
 [4 5]]
[[6 5 4]
 [9 8 7]]
[[9 8 7]
 [6 5 4]
 [3 2 1]]


### 불리언 인덱싱(Boolean Indexing)

* 배열 각 요소의 선택 여부를 불리언(True or False)로 지정
* True 값인 인덱스의 값만 조회

In [42]:
print(a1)
bi = [False, True, True, False, True]
print(a1[bi])
bi = [True, False, True, True, False]
print(a1[bi])

[1 2 3 4 5]
[2 3 5]
[1 3 4]


In [43]:
print(a2)
bi = np.random.randint(0, 2, (3,3), dtype=bool)
print(bi) # 랜덤으로 만들어버리기
print(a2[bi])

[[1 2 3]
 [4 5 6]
 [7 8 9]]
[[False False False]
 [False False  True]
 [False  True False]]
[6 8]


### 팬시 인덱싱(Fancy Indedxing)

In [44]:
print(a1)
print([a1[0], a1[2]])
ind = [0,2]
print(a1[ind])
ind = np.array([[0,1], [2,0]])
print(a1[ind]) # 일차원에 이차원 인덱스를 주면 이차원이 출력된다

[1 2 3 4 5]
[1, 3]
[1 3]
[[1 2]
 [3 1]]


In [45]:
print(a2)
row = np.array([0,2])
col = np.array([1,2])
print (a2[row, col])
print(a2[row, :])
print(a2[:, col])
print(a2 [row, 1])
print(a2[2, col])
print(a2[row, 1:])
print(a2[1:, col])

[[1 2 3]
 [4 5 6]
 [7 8 9]]
[2 9]
[[1 2 3]
 [7 8 9]]
[[2 3]
 [5 6]
 [8 9]]
[2 8]
[8 9]
[[2 3]
 [8 9]]
[[5 6]
 [8 9]]




---



## 배열 값 삽입/수정/삭제/복사

### 배열 값 삽입

* `insert()`: 배열의 특정 위치에 값 삽입
* axis를 지정하지 않으면 1차원 배열로 변환
* 추가할 방향을 axis로 지정
* 원본 배열 변경없이 새로운 배열 반환

In [46]:
print(a1)
b1 = np.insert(a1, 0, 10)
print(b1)
c1 = np.insert(a1, 2, 10)
print(c1)

[1 2 3 4 5]
[10  1  2  3  4  5]
[ 1  2 10  3  4  5]


In [47]:
print(a2)
b2 = np.insert(a2, 1, 10, axis=0) # 행에다가 insert
print(b2)
c2 = np.insert(a2, 1, 10, axis=1) # 열에다가 insert
print(c2)

[[1 2 3]
 [4 5 6]
 [7 8 9]]
[[ 1  2  3]
 [10 10 10]
 [ 4  5  6]
 [ 7  8  9]]
[[ 1 10  2  3]
 [ 4 10  5  6]
 [ 7 10  8  9]]


### 배열 값 수정

* 배열의 인덱싱으로 접근하여 값 수정

In [48]:
a1 = np.array([1,2,3,3,5])
print(a1)
a1[:1] = 9
print(a1)
i = np.array([1,3,4])
a1[i] += 4
print(a1)

[1 2 3 3 5]
[9 2 3 3 5]
[9 6 3 7 9]


In [49]:
print(a2)
a2[0, 0] = 1
a2[1, 1] = 2
a2[2, 2] = 3
a2[0] = 1
print(a2)
a2[1:, 2] = 9
print(a2)
row = np.array([0, 1])
col = np.array([1, 2])
a2[row, col] = 0
print(a2)

[[1 2 3]
 [4 5 6]
 [7 8 9]]
[[1 1 1]
 [4 2 6]
 [7 8 3]]
[[1 1 1]
 [4 2 9]
 [7 8 9]]
[[1 0 1]
 [4 2 0]
 [7 8 9]]


### 배열 값 삭제

* `delete()`: 배열의 특정 위치에 값 삭제
* axis를 지정하지 않으면 1차원 배열로 변환
* 삭제할 방향을 axis로 지정
* 원본 배열 변경없이 새로운 배열 반환

In [50]:
print(a1)
b1 = np. delete(a1, 1)
print(b1)
print(a1)

[9 6 3 7 9]
[9 3 7 9]
[9 6 3 7 9]


In [51]:
print(a2)
b2 = np.delete(a2, 1, axis=0) # 원본은 바뀌지 않는다
print(b2)
c2 = np.delete(a2, 1, axis=1) # 원본은 바뀌지 않는다
print(c2)

[[1 0 1]
 [4 2 0]
 [7 8 9]]
[[1 0 1]
 [7 8 9]]
[[1 1]
 [4 0]
 [7 9]]


### 배열 복사

* 리스트 자료형과 달리 배열의 슬라이스는 복사본이 아님

In [56]:
print(a2)
print(a2[:2, :2])
a2_sub = a2[:2, :2] # slicing 해서 배열 복사
print(a2_sub) # 복사본
a2_sub[:, 1] = 5
print(a2_sub) # 특정 부분만 5로 바꾸기
print(a2) # 그런데 a2를 다시 보니까 원본 배열이 배뀌어 있다!!!!!!!
# 동일한 메모리 위치를 복사해서 슬라이싱하기 때문에 원본 배열이 같이 바뀐다

[[1 0 1]
 [4 0 0]
 [7 8 9]]
[[1 0]
 [4 0]]
[[1 0]
 [4 0]]
[[1 5]
 [4 5]]
[[1 5 1]
 [4 5 0]
 [7 8 9]]



* `copy()`: 배열이나 하위 배열 내의 값을 명시적으로 복사

In [58]:
# 원본을 그대로 두고 복사를 하고 싶으면 이 함수를 명시해야한다
print(a2)
a2_sub_copy = a2[:2, :2].copy()
print(a2_sub_copy)
a2_sub_copy[:, 1] = 1
print(a2_sub_copy)
print(a2) # 예상했듯이 바뀌지 않았다, 서로 다른 메모리 위치에 있는 값

[[1 5 1]
 [4 5 0]
 [7 8 9]]
[[1 5]
 [4 5]]
[[1 1]
 [4 1]]
[[1 5 1]
 [4 5 0]
 [7 8 9]]




---



## 배열 변환

### 배열 전치 및 축 변경

In [60]:
print(a2)
print(a2.T) # Transpose 하는 방법

[[1 5 1]
 [4 5 0]
 [7 8 9]]
[[1 4 7]
 [5 5 8]
 [1 0 9]]


In [61]:
print(a3)
print(a3.T) # Transpose 하는 방법

[[[1 2 3]
  [4 5 6]
  [7 8 9]]

 [[1 2 3]
  [4 5 6]
  [7 8 9]]

 [[1 2 3]
  [4 5 6]
  [7 8 9]]]
[[[1 1 1]
  [4 4 4]
  [7 7 7]]

 [[2 2 2]
  [5 5 5]
  [8 8 8]]

 [[3 3 3]
  [6 6 6]
  [9 9 9]]]


In [62]:
print(a2)
print(a2.swapaxes(1,0)) # 축을 바꿔주면 transpose와 같은 결과가 나온다

[[1 5 1]
 [4 5 0]
 [7 8 9]]
[[1 4 7]
 [5 5 8]
 [1 0 9]]


In [65]:
print(a3)
print(a3.swapaxes(0,1))
print(a3.swapaxes(1,2))

[[[1 2 3]
  [4 5 6]
  [7 8 9]]

 [[1 2 3]
  [4 5 6]
  [7 8 9]]

 [[1 2 3]
  [4 5 6]
  [7 8 9]]]
[[[1 2 3]
  [1 2 3]
  [1 2 3]]

 [[4 5 6]
  [4 5 6]
  [4 5 6]]

 [[7 8 9]
  [7 8 9]
  [7 8 9]]]
[[[1 4 7]
  [2 5 8]
  [3 6 9]]

 [[1 4 7]
  [2 5 8]
  [3 6 9]]

 [[1 4 7]
  [2 5 8]
  [3 6 9]]]


### 배열 재구조화


* `reshape()`: 배열의 형상을 변경

In [68]:
n1 = np.arange(1, 10)
print(n1)
print(n1.reshape(3, 3))

[1 2 3 4 5 6 7 8 9]
[[1 2 3]
 [4 5 6]
 [7 8 9]]


* `newaxis()`: 새로운 축 추가

In [69]:
print(n1)
print(n1[np.newaxis, :5])
print(n1[:5, np.newaxis])

[1 2 3 4 5 6 7 8 9]
[[1 2 3 4 5]]
[[1]
 [2]
 [3]
 [4]
 [5]]


### 배열 크기 변경

* 배열 모양만 변경

In [83]:
n2 = np.random.randint(0,10,(2,5))
print(n2)
n2.resize((5,2))
print(n2) # 배열 모양이 바뀜

[[8 0 4 4 1]
 [6 8 9 1 5]]
[[8 0]
 [4 4]
 [1 6]
 [8 9]
 [1 5]]


* 배열 크기 증가
* 남은 공간은 0으로 채워짐

In [84]:
n2.resize((5,5))
print(n2) # 0으로 채워짐

[[8 0 4 4 1]
 [6 8 9 1 5]
 [0 0 0 0 0]
 [0 0 0 0 0]
 [0 0 0 0 0]]


* 배열 크기 감소
* 포함되지 않은 값은 삭제됨

In [85]:
n2.resize((3,3))
print(n2) # 끝에 하나 삭제됨

[[8 0 4]
 [4 1 6]
 [8 9 1]]


### 배열 추가

* `append()`: 배열의 끝에 값 추가

In [87]:
# 모양 같은 배열 두개 생성
a2 = np.arange(1,10).reshape(3,3)
print(n2)
b2 = np.arange(10, 19).reshape(3,3)
print(b2)

[[8 0 4]
 [4 1 6]
 [8 9 1]]
[[10 11 12]
 [13 14 15]
 [16 17 18]]


* axis 지정이 없으면 1차원 배열 형태로 변형되어 결합

In [88]:
c2 = np.append(a2, b2) # a2에  b2를 append하기
print(c2)

[ 1  2  3  4  5  6  7  8  9 10 11 12 13 14 15 16 17 18]


* axis를 0으로 지정
* shape[0]을 제외한 나머지 shape은 같아야 함

In [89]:
# 축을 뭘로 지정하냐에 따라 달라진다
c2 = np.append(a2, b2, axis=0)
print(c2)

[[ 1  2  3]
 [ 4  5  6]
 [ 7  8  9]
 [10 11 12]
 [13 14 15]
 [16 17 18]]


* axis를 1로 지정
* shape[1]을 제외한 나머지 shape은 같아야 함

In [90]:
c2 = np.append(a2, b2, axis=1)
print(c2)

[[ 1  2  3 10 11 12]
 [ 4  5  6 13 14 15]
 [ 7  8  9 16 17 18]]


### 배열 연결

* `concatenate()`: 튜플이나 배열의 리스트를 인수로 사용해 배열 연결

In [99]:
a1 = np.array([1, 3, 5])
b1 = np.array([2, 4, 6])
np.concatenate([a1, b1])

array([1, 3, 5, 2, 4, 6])

In [100]:
c1 = np.array([7,8,9])
np.concatenate([a1,b1,c1])

array([1, 3, 5, 2, 4, 6, 7, 8, 9])

In [102]:
a2 = np.array([[1,2,3],
             [4,5,6]])
np.concatenate([a2,a2]) # axis=0 으로 나온다

array([[1, 2, 3],
       [4, 5, 6],
       [1, 2, 3],
       [4, 5, 6]])

In [105]:
a2 = np.array([[1,2,3],
             [4,5,6]])
np.concatenate([a2,a2], axis=1)

array([[1, 2, 3, 1, 2, 3],
       [4, 5, 6, 4, 5, 6]])

* `vstack()`: 수직 스택(vertical stack), 1차원으로 연결

In [106]:
np.vstack([a2,a2])

array([[1, 2, 3],
       [4, 5, 6],
       [1, 2, 3],
       [4, 5, 6]])

* `hstack()`: 수평 스택(horizontal stack), 2차원으로 연결

In [107]:
np.hstack([a2,a2])

array([[1, 2, 3, 1, 2, 3],
       [4, 5, 6, 4, 5, 6]])

* `dstack()`: 깊이 스택(depth stack), 3차원으로 연결

In [111]:
np.dstack([a2,a2])
# 아직 2차원임

array([[[1, 1],
        [2, 2],
        [3, 3]],

       [[4, 4],
        [5, 5],
        [6, 6]]])

* `stack()`: 새로운 차원으로 연결

In [110]:
np.stack([a2,a2]) 
# 3차원으로 바뀐것

array([[[1, 2, 3],
        [4, 5, 6]],

       [[1, 2, 3],
        [4, 5, 6]]])

### 배열 분할

* `split()`: 배열 분할

In [116]:
a1 = np.arange(0,10)
print(a1)
# 두개로 split)()
b1, c1 = np.split(a1, [5]) # 자르는 인덱스 지정
print(b1, c1)
# 여러개로 split()
b1, c1, d1, e1 = np.split(a1, [2,4,7]) # 여러개의 인덱스 지정
print(b1, c1, d1, e1)

[0 1 2 3 4 5 6 7 8 9]
[0 1 2 3 4] [5 6 7 8 9]
[0 1] [2 3] [4 5 6] [7 8 9]


verticle split
* `vsplit()`: 수직 분할, 1차원으로 분할  

In [124]:
a2 = np.arange(1, 10).reshape(3, 3)
print(a2)
b2, c2 = np.split(a2, [2])
print(b2)
print(c2)

[[1 2 3]
 [4 5 6]
 [7 8 9]]
[[1 2 3]
 [4 5 6]]
[[7 8 9]]


horizontal split
* `hsplit()`: 수평 분할, 2차원으로 분할  


In [126]:
a2 = np.arange(1, 10).reshape(3, 3)
print(a2)
b2, c2 = np.hsplit(a2, [2])
print(b2)
print(c2)

[[1 2 3]
 [4 5 6]
 [7 8 9]]
[[1 2]
 [4 5]
 [7 8]]
[[3]
 [6]
 [9]]


depth split
* `dsplit()`: 깊이 분할, 3차원으로 분할

In [133]:
a2 = np.arange(1, 28).reshape(3, 3, 3)
print(a2)
b2, c2 = np.dsplit(a2, [2])
print(b2)
print(c2)

[[[ 1  2  3]
  [ 4  5  6]
  [ 7  8  9]]

 [[10 11 12]
  [13 14 15]
  [16 17 18]]

 [[19 20 21]
  [22 23 24]
  [25 26 27]]]
[[[ 1  2]
  [ 4  5]
  [ 7  8]]

 [[10 11]
  [13 14]
  [16 17]]

 [[19 20]
  [22 23]
  [25 26]]]
[[[ 3]
  [ 6]
  [ 9]]

 [[12]
  [15]
  [18]]

 [[21]
  [24]
  [27]]]




---



## 배열 연산

* NumPy의 배열 연산은 벡터화(vectorized) 연산을 사용
* 일반적으로 NumPy의 범용 함수(universal functions)를 통해 구현
* 배열 요소에 대한 반복적인 계산을 효율적으로 수행

### 브로드캐스팅(Broadcasting)
numpy의 장점: 다른 shape을 가져도 맞춰준다. 값들이 있다고 가정하고 브로드캐스팅 한다.

![image.png](attachment:image.png)

In [137]:
a1 = np.array([1,2,3])
print(a1)
print(a1 + 5) # 브로드캐스팅 된 것이다!!

[1 2 3]
[6 7 8]


![image.png](attachment:image.png)

In [138]:
a2 = np.arange(1,10).reshape(3,3)
print(a2)
print(a1 + a2) # 브로드캐스팅 된 것이다!!

[[1 2 3]
 [4 5 6]
 [7 8 9]]
[[ 2  4  6]
 [ 5  7  9]
 [ 8 10 12]]


![image.png](attachment:image.png)

In [140]:
b2 = np.array([1,2,3]).reshape(3,1)
print(b2)
print(a1 + b2) # 브로드캐스팅 된 것이다!!

[[1]
 [2]
 [3]]
[[2 3 4]
 [3 4 5]
 [4 5 6]]


### 산술 연산(Arithmetic Operators)
연산을 연산자로 사용할 수 있지만 범용함수로도 사용 가능하다

![image.png](attachment:image.png)

In [156]:
a1 = np.arange(1, 10)
print(a1)
print(a1 + 1)
print(np.add(a1, 10)) # 덧셈
print(a1 - 2)
print(np.subtract(a1, 10)) # 뺄셈
print(-a1)
print(np.negative(a1)) # 단항 음수
print(a1 * 2)
print(np.multiply(a1, 2)) # 곱셈
print(a1 / 2)
print(np.divide(a1, 2)) # 나눗셈 
print(a1 // 2) 
print(np.floor_divide(a1, 2)) # 나눗셈 내림
print(a1 ** 2)
print(np.power(a1, 2)) # 지수 연산
print(a1 % 2)
print(np.mod(a1, 2)) # 나머지 연산

[1 2 3 4 5 6 7 8 9]
[ 2  3  4  5  6  7  8  9 10]
[11 12 13 14 15 16 17 18 19]
[-1  0  1  2  3  4  5  6  7]
[-9 -8 -7 -6 -5 -4 -3 -2 -1]
[-1 -2 -3 -4 -5 -6 -7 -8 -9]
[-1 -2 -3 -4 -5 -6 -7 -8 -9]
[ 2  4  6  8 10 12 14 16 18]
[ 2  4  6  8 10 12 14 16 18]
[0.5 1.  1.5 2.  2.5 3.  3.5 4.  4.5]
[0.5 1.  1.5 2.  2.5 3.  3.5 4.  4.5]
[0 1 1 2 2 3 3 4 4]
[0 1 1 2 2 3 3 4 4]
[ 1  4  9 16 25 36 49 64 81]
[ 1  4  9 16 25 36 49 64 81]
[1 0 1 0 1 0 1 0 1]
[1 0 1 0 1 0 1 0 1]


In [163]:
# 배열끼리의 계산
al = np.arange (1, 10)
print(a1)
b1 = np.random.randint(1, 10, size=9)
print(b1)
print(a1 + b1)
print(a1 - b1)
print(al * b1)
print(a1 / b1)
print(a1 // b1)
print(a1 ** b1)
print(a1 % b1)

[1 2 3 4 5 6 7 8 9]
[2 6 1 9 2 9 4 8 6]
[ 3  8  4 13  7 15 11 16 15]
[-1 -4  2 -5  3 -3  3  0  3]
[ 2 12  3 36 10 54 28 64 54]
[0.5        0.33333333 3.         0.44444444 2.5        0.66666667
 1.75       1.         1.5       ]
[0 0 3 0 2 0 1 1 1]
[       1       64        3   262144       25 10077696     2401 16777216
   531441]
[1 2 0 4 1 6 3 0 3]


In [164]:
# 2차원 배열끼리의 계산
a2 = np.arange(1,10).reshape(3,3)
print(a2)
b2 = np.random.randint(1, 10, size=(3, 3))
print(b2)
print(a2 + b2)
print(a2 - b2)
print(a2 * b2)
print(a2 / b2)
print(a2 // b2)
print(a2 ** b2)
print(a2 % b2)

[[1 2 3]
 [4 5 6]
 [7 8 9]]
[[4 4 6]
 [3 6 3]
 [3 5 6]]
[[ 5  6  9]
 [ 7 11  9]
 [10 13 15]]
[[-3 -2 -3]
 [ 1 -1  3]
 [ 4  3  3]]
[[ 4  8 18]
 [12 30 18]
 [21 40 54]]
[[0.25       0.5        0.5       ]
 [1.33333333 0.83333333 2.        ]
 [2.33333333 1.6        1.5       ]]
[[0 0 0]
 [1 0 2]
 [2 1 1]]
[[     1     16    729]
 [    64  15625    216]
 [   343  32768 531441]]
[[1 2 3]
 [1 5 0]
 [1 3 3]]


#### 절대값 함수(Absolute Function)

* `absolute()`, `abs()`: 내장된 절대값 함수

In [166]:
a1 = np.random.randint(-10, 10, size=5)
print(a1)
print(np.absolute(a1))
print(np.abs(a1))

[ 3 -5 -5  4  8]
[3 5 5 4 8]
[3 5 5 4 8]


#### 제곱/제곱근 함수

* `square`, `sqrt`: 제곱, 제곱근 함수

In [170]:
a1 = np.random.randint(-10, 10, size=5)
print(a1)
print(np.square(a1))
print(np.sqrt(a1)) # 음수는 nan이 나온다

[  9  -2   4   4 -10]
[ 81   4  16  16 100]
[ 3. nan  2.  2. nan]


  print(np.sqrt(a1)) # 음수는 nan


#### 지수와 로그 함수 (Exponential and Log Function)

In [178]:
# 지수 
a1 = np.random.randint(1, 10, size=5)
print(a1) 
print(np.exp(a1)) 
print(np.exp2(a1))
print(np.power(a1,2)) 

[3 6 4 9 9]
[  20.08553692  403.42879349   54.59815003 8103.08392758 8103.08392758]
[  8.  64.  16. 512. 512.]
[ 9 36 16 81 81]


In [179]:
# 로그
print(a1)
print(np.log(a1))
print(np.log2(a1))
print(np.log10(a1))

[3 6 4 9 9]
[1.09861229 1.79175947 1.38629436 2.19722458 2.19722458]
[1.5849625 2.5849625 2.        3.169925  3.169925 ]
[0.47712125 0.77815125 0.60205999 0.95424251 0.95424251]


#### 삼각 함수(Trigonometrical Function)


![image.png](attachment:image.png)

In [181]:
t = np.linspace(0, np.pi, 3) # 0, 중간값, pi
print(t)
print(np.sin(t))
print(np.cos(t))
print(np.tan(t))

[0.         1.57079633 3.14159265]
[0.0000000e+00 1.0000000e+00 1.2246468e-16]
[ 1.000000e+00  6.123234e-17 -1.000000e+00]
[ 0.00000000e+00  1.63312394e+16 -1.22464680e-16]


In [183]:
x = [-1, 0, 1]
print(x)
print(np.arcsin(x))
print(np.arccos(x))
print(np.arctan(x))

[-1, 0, 1]
[-1.57079633  0.          1.57079633]
[3.14159265 1.57079633 0.        ]
[-0.78539816  0.          0.78539816]


### 집계 함수(Aggregate Functions)

#### sum(): 합 계산

In [188]:
a2 = np.random.randint(1, 10, size=(3,3))
print(a2)
print(a2.sum(), np.sum(a2)) # 두가지 방법이 있다
print(a2.sum(axis=0), np.sum(a2, axis=0)) # 축을 기반으로 합 계산
print(a2.sum(axis=1), np.sum(a2, axis=1)) # 축을 기반으로 합 계산

[[2 7 1]
 [3 6 9]
 [9 5 5]]
47 47
[14 18 15] [14 18 15]
[10 18 19] [10 18 19]


#### cumsum(): 누적합 계산

In [189]:
print(a2)
print(np.cumsum(a2))
print(np.cumsum(a2, axis=0)) 
print(np.cumsum(a2, axis=1)) 

[[2 7 1]
 [3 6 9]
 [9 5 5]]
[ 2  9 10 13 19 28 37 42 47]
[[ 2  7  1]
 [ 5 13 10]
 [14 18 15]]
[[ 2  9 10]
 [ 3  9 18]
 [ 9 14 19]]


#### diff(): 차분 계산

In [190]:
print(a2)
print(np.diff(a2))
print(np.diff(a2, axis=0)) 
print(np.diff(a2, axis=1)) 

[[2 7 1]
 [3 6 9]
 [9 5 5]]
[[ 5 -6]
 [ 3  3]
 [-4  0]]
[[ 1 -1  8]
 [ 6 -1 -4]]
[[ 5 -6]
 [ 3  3]
 [-4  0]]


#### prod(): 곱 계산

In [191]:
print(a2)
print(np.prod(a2)) # 다 곱한것
print(np.prod(a2, axis=0)) 
print(np.prod(a2, axis=1)) 

[[2 7 1]
 [3 6 9]
 [9 5 5]]
510300
[ 54 210  45]
[ 14 162 225]


#### cumprod(): 누적곱 계산

In [192]:
print(a2)
print(np.cumprod(a2))
print(np.cumprod(a2, axis=0)) 
print(np.cumprod(a2, axis=1)) 

[[2 7 1]
 [3 6 9]
 [9 5 5]]
[     2     14     14     42    252   2268  20412 102060 510300]
[[  2   7   1]
 [  6  42   9]
 [ 54 210  45]]
[[  2  14  14]
 [  3  18 162]
 [  9  45 225]]


#### dot()/matmul(): 점곱/행렬곱 계산

In [193]:
print(a2)
b2 = np.ones_like(a2)
print(b2)
print(np.dot(a2,b2))
print(np.matmul(a2,b2))

[[2 7 1]
 [3 6 9]
 [9 5 5]]
[[1 1 1]
 [1 1 1]
 [1 1 1]]
[[10 10 10]
 [18 18 18]
 [19 19 19]]
[[10 10 10]
 [18 18 18]
 [19 19 19]]


#### tensordot(): 텐서곱 계산

In [196]:
print(a2)
print(b2)
print(np.tensordot(a2,b2))
print(np.tensordot(a2,b2, axes=0))
print(np.tensordot(a2,b2, axes=1)) # dotprod와 결과가 같다

[[2 7 1]
 [3 6 9]
 [9 5 5]]
[[1 1 1]
 [1 1 1]
 [1 1 1]]
47
[[[[2 2 2]
   [2 2 2]
   [2 2 2]]

  [[7 7 7]
   [7 7 7]
   [7 7 7]]

  [[1 1 1]
   [1 1 1]
   [1 1 1]]]


 [[[3 3 3]
   [3 3 3]
   [3 3 3]]

  [[6 6 6]
   [6 6 6]
   [6 6 6]]

  [[9 9 9]
   [9 9 9]
   [9 9 9]]]


 [[[9 9 9]
   [9 9 9]
   [9 9 9]]

  [[5 5 5]
   [5 5 5]
   [5 5 5]]

  [[5 5 5]
   [5 5 5]
   [5 5 5]]]]
[[10 10 10]
 [18 18 18]
 [19 19 19]]


#### cross(): 벡터곱

In [197]:
x = [1,2,3]
y = [4,5,6]
print(np.cross(x,y))
# 2*6 - 3*5 = -3 ... cross product 기억하지...?

[-3  6 -3]


#### inner()/outer(): 내적/외적

In [198]:
print(a2)
print(b2)
print(np.inner(a2,b2)) # inner product: dotprod와 같다
print(np.outer(a2,b2)) # outer product

[[2 7 1]
 [3 6 9]
 [9 5 5]]
[[1 1 1]
 [1 1 1]
 [1 1 1]]
[[10 10 10]
 [18 18 18]
 [19 19 19]]
[[2 2 2 2 2 2 2 2 2]
 [7 7 7 7 7 7 7 7 7]
 [1 1 1 1 1 1 1 1 1]
 [3 3 3 3 3 3 3 3 3]
 [6 6 6 6 6 6 6 6 6]
 [9 9 9 9 9 9 9 9 9]
 [9 9 9 9 9 9 9 9 9]
 [5 5 5 5 5 5 5 5 5]
 [5 5 5 5 5 5 5 5 5]]


#### mean(): 평균 계산

In [199]:
print(a2)
print(np.mean(a2))
print(np.mean(a2, axis=0))
print(np.mean(a2, axis=1))

[[2 7 1]
 [3 6 9]
 [9 5 5]]
5.222222222222222
[4.66666667 6.         5.        ]
[3.33333333 6.         6.33333333]


#### std(): 표준 편차 계산

In [200]:
print(a2)
print(np.std(a2))
print(np.std(a2, axis=0))
print(np.std(a2, axis=1))

[[2 7 1]
 [3 6 9]
 [9 5 5]]
2.698879511442471
[3.09120617 0.81649658 3.26598632]
[2.62466929 2.44948974 1.88561808]


#### var(): 분산 계산

In [201]:
print(a2)
print(np.var(a2))
print(np.var(a2, axis=0))
print(np.var(a2, axis=1))

[[2 7 1]
 [3 6 9]
 [9 5 5]]
7.283950617283951
[ 9.55555556  0.66666667 10.66666667]
[6.88888889 6.         3.55555556]


#### min(): 최소값

In [202]:
print(a2)
print(np.min(a2))
print(np.min(a2, axis=0))
print(np.min(a2, axis=1))

[[2 7 1]
 [3 6 9]
 [9 5 5]]
1
[2 5 1]
[1 3 5]


#### max(): 최대값

In [203]:
print(a2)
print(np.max(a2))
print(np.max(a2, axis=0))
print(np.max(a2, axis=1))

[[2 7 1]
 [3 6 9]
 [9 5 5]]
9
[9 7 9]
[7 9 9]


#### argmin(): 최소값 인덱스

In [205]:
print(a2)
print(np.argmin(a2))
print(np.argmin(a2, axis=0))
print(np.argmin(a2, axis=1))

[[2 7 1]
 [3 6 9]
 [9 5 5]]
2
[0 2 0]
[2 0 1]


#### argmax(): 최대값 인덱스

In [206]:
print(a2)
print(np.argmax(a2))
print(np.argmax(a2, axis=0))
print(np.argmax(a2, axis=1))

[[2 7 1]
 [3 6 9]
 [9 5 5]]
5
[2 0 1]
[1 2 0]


#### median(): 중앙값

In [207]:
print(a2)
print(np.median(a2))
print(np.median(a2, axis=0))
print(np.median(a2, axis=1))

[[2 7 1]
 [3 6 9]
 [9 5 5]]
5.0
[3. 6. 5.]
[2. 6. 5.]


#### percentile(): 백분위 수
image.png    
<img src="attachment:image.png" width="500"/>


In [212]:
a1 = np.array([0,1,2,3])
print(a1)
# 어떤 interpolation을 할건지에 따라 결과값이 다르다
print(np.percentile(a1, [0,20,40,60,80,100], method='linear'))
print(np.percentile(a1, [0,20,40,60,80,100], method='higher'))
print(np.percentile(a1, [0,20,40,60,80,100], method='lower'))
print(np.percentile(a1, [0,20,40,60,80,100], method='nearest'))
print(np.percentile(a1, [0,20,40,60,80,100], method='midpoint'))

[0 1 2 3]
[0.  0.6 1.2 1.8 2.4 3. ]
[0 1 2 2 3 3]
[0 0 1 1 2 3]
[0 1 1 2 2 3]
[0.  0.5 1.5 1.5 2.5 3. ]


#### any()
- 1개라고 True이면 True

In [217]:
a2 = np. array([[False, False, False],
                [False, True, True],
                [False, True, True]])
print(a2)
print(np.any(a2))
print(np.any(a2, axis=0))
print(np.any(a2, axis=1))

[[False False False]
 [False  True  True]
 [False  True  True]]
True
[False  True  True]
[False  True  True]


#### all()
모두 True이면 True

In [218]:
a2 = np. array([[False, False, True],
                [True, True, True],
                [False, True, True]])
print(a2)
print(np.all(a2))
print(np.all(a2, axis=0))
print(np.all(a2, axis=1))

[[False False  True]
 [ True  True  True]
 [False  True  True]]
False
[False False  True]
[False  True False]


### 비교 연산(Comparison Operators)


In [220]:
a1 = np.arange(1,10)
print(a1)
print(a1 == 5) # 5인 위치만 True인 boolean값이 나온다
print(a1 != 5)
print(a1 < 5)
print(a1 <= 5)
print(a1 > 5)
print(al >= 5)

[1 2 3 4 5 6 7 8 9]
[False False False False  True False False False False]
[ True  True  True  True False  True  True  True  True]
[ True  True  True  True False False False False False]
[ True  True  True  True  True False False False False]
[False False False False False  True  True  True  True]
[False False False False  True  True  True  True  True]


In [230]:
a2 = np.arange(1, 10).reshape(3, 3)
print(a2)
print(np.sum(al))
print(np.count_nonzero(a2 > 5)) # nonzero인 것의 갯수
print("np.sum()")
print(np.sum(a2 > 5))
print(np.sum(a2 > 5, axis=0))
print(np.sum(a2 > 5, axis=1))
print("np.any()")
print(np.any(a2 > 5))
print(np.any(a2 > 5, axis=0))
print(np.any(a2 > 5, axis=1))
print("np.all()")
print(np.all(a2 > 5))
print(np.all(a2 > 5, axis=0))
print(np.all(a2 > 5, axis=1))

[[1 2 3]
 [4 5 6]
 [7 8 9]]
45
4
np.sum()
4
[1 1 2]
[0 1 3]
np.any()
True
[ True  True  True]
[False  True  True]
np.all()
False
[False False False]
[False False  True]


![image.png](attachment:image.png)

In [231]:
a1 = np.array([1, 2, 3, 4, 5])
print(a1)
b1 = np.array([1, 2, 3, 3, 4])
print (b1)
print(np.isclose(a1, b1))

[1 2 3 4 5]
[1 2 3 3 4]
[ True  True  True False False]


In [235]:
a1 = np.array([np.nan, 2, np.inf, 4, np.NINF])
print(a1)
print(np.isnan(a1)) # nan이면 True
print(np.isinf(a1)) # inf(무한대)이면 True
print(np.isfinite(a1)) # 무한대가 아니면 True

[ nan   2.  inf   4. -inf]
[ True False False False False]
[False False  True False  True]
[False  True False  True False]


#### 불리언 연산자(Boolean Operators)


In [241]:
a2 = np.arange(1,10).reshape(3,3)
print(a2)
# and
print((a2 > 5) & (a2 < 8)) # boolean값
print(a2[(a2 > 5) & (a2 < 8)]) # boolean값을 사용해서 True인 인덱스만 출력
# or
print((a2 > 5) | (a2 < 8)) 
print(a2[(a2 > 5) | (a2 < 8)]) 
# and 의 여집합 (한개만 만족)
print((a2 > 5) ^ (a2 < 8)) 
print(a2[(a2 > 5) ^ (a2 < 8)]) 
# not
print(~(a2 > 5)) 
print(a2[~(a2 > 5)]) 

[[1 2 3]
 [4 5 6]
 [7 8 9]]
[[False False False]
 [False False  True]
 [ True False False]]
[6 7]
[[ True  True  True]
 [ True  True  True]
 [ True  True  True]]
[1 2 3 4 5 6 7 8 9]
[[ True  True  True]
 [ True  True False]
 [False  True  True]]
[1 2 3 4 5 8 9]
[[ True  True  True]
 [ True  True False]
 [False False False]]
[1 2 3 4 5]


### 배열 정렬

In [248]:
a1 = np.random.randint(1,10,size=10)
print(a1)
print(np.sort(a1)) # 정렬
print(a1) # 원본 배열은 바뀌지 않는다
print(np.argsort(a1)) # 정렬을 한 값의 인덱스
print(a1) # 원본 배열은 바뀌지 않는다
print(a1.sort()) # 이렇게 하면 원본 배열이 바뀐다
print(a1)

[2 9 7 3 5 1 2 2 9 3]
[1 2 2 2 3 3 5 7 9 9]
[2 9 7 3 5 1 2 2 9 3]
[5 0 6 7 3 9 4 2 1 8]
[2 9 7 3 5 1 2 2 9 3]
None
[1 2 2 2 3 3 5 7 9 9]


In [252]:
a2 = np.random.randint(1,10, size=(3,3))
print(a2)
print(np.sort(a2, axis=0))
print(np.sort(a2, axis=1))

[[7 4 8]
 [9 9 8]
 [3 1 7]]
[[3 1 7]
 [7 4 8]
 [9 9 8]]
[[4 7 8]
 [8 9 9]
 [1 3 7]]


#### 부분 정렬

* `partition()`: 배열에서 k개의 작은 값을 반환

In [253]:
a1 = np.random.randint(1, 10, size=10)
print(a1)
print(np.partition(a1, 3)) 
# 가장 작은값 1,1,2가 앞으로 나왔다

[4 8 9 3 2 7 3 3 1 1]
[1 1 2 3 3 3 8 7 9 4]


In [260]:
a2 = np.random.randint(1, 10, size=(5,5))
print(a2)
print(np.partition(a2, 3)) 
print(np.partition(a2, 3, axis=0))
print(np.partition(a2, 3, axis=1)) # default와 같다

[[9 5 8 8 2]
 [4 1 9 5 1]
 [8 1 9 5 7]
 [8 5 6 4 7]
 [2 9 4 4 3]]
[[5 2 8 8 9]
 [1 1 4 5 9]
 [5 7 1 8 9]
 [4 6 5 7 8]
 [2 3 4 4 9]]
[[4 1 6 4 1]
 [2 1 4 4 2]
 [8 5 8 5 3]
 [8 5 9 5 7]
 [9 9 9 8 7]]
[[5 2 8 8 9]
 [1 1 4 5 9]
 [5 7 1 8 9]
 [4 6 5 7 8]
 [2 3 4 4 9]]


## 배열 입출력
![image.png](attachment:image.png)
  
저장하는 여러가지 method

In [262]:
a2 = np.random.randint(1,10,size=(5,5))
print(a2)
np.save('a', a2)

[[5 7 9 8 6]
 [5 2 5 5 9]
 [9 7 8 6 6]
 [8 9 5 1 2]
 [9 1 8 4 7]]


In [263]:
!ls
# a.npy 라는 파일이 생성되었다
# 확장자는 npy

_Matplotlib_한번에_제대로_배우기.ipynb
_NumPy_한번에_제대로_배우기.ipynb
_Pandas_한번에_제대로_배우기.ipynb
a.npy


In [266]:
b2 = np.random.randint(1,10,size=(5,5))
print(b2)
np.savez('ab', a2, b2) # 여러개의 파일을 저장해보자

[[5 8 6 7 8]
 [6 1 3 2 6]
 [2 7 3 3 7]
 [4 3 6 4 6]
 [7 9 4 9 8]]


In [268]:
!ls
#  여러개의 파일이 저장되어 있는 ab.npz 라는 파일이 생성되었다
# 확장자는 npz

_Matplotlib_한번에_제대로_배우기.ipynb
_NumPy_한번에_제대로_배우기.ipynb
_Pandas_한번에_제대로_배우기.ipynb
a.npy
ab.npz


In [270]:
npy = np.load('a.npy')
print(npy)
# 저장된 파일 불러오기

[[5 7 9 8 6]
 [5 2 5 5 9]
 [9 7 8 6 6]
 [8 9 5 1 2]
 [9 1 8 4 7]]


In [271]:
npz = np.load('ab.npz')
print(npz.files) 
# 2개의 파일이 안에 있다는 것을 알 수 있다

['arr_0', 'arr_1']


In [273]:
# 이러한 파일에 접근하려면
print(npz['arr_0']) # a2
print(npz['arr_1']) # b2

[[5 7 9 8 6]
 [5 2 5 5 9]
 [9 7 8 6 6]
 [8 9 5 1 2]
 [9 1 8 4 7]]
[[5 8 6 7 8]
 [6 1 3 2 6]
 [2 7 3 3 7]
 [4 3 6 4 6]
 [7 9 4 9 8]]


In [275]:
print(a2)
# text로 저장하고 싶으면, csv파일로 저장
np.savetxt('a.csv', a2, delimiter=',')

[[5 7 9 8 6]
 [5 2 5 5 9]
 [9 7 8 6 6]
 [8 9 5 1 2]
 [9 1 8 4 7]]


In [276]:
!ls
# a.csv 이 생겼음을 알 수 있다

_Matplotlib_한번에_제대로_배우기.ipynb
_NumPy_한번에_제대로_배우기.ipynb
_Pandas_한번에_제대로_배우기.ipynb
a.csv
a.npy
ab.npz


In [277]:
!cat a.csv
# text이기 때문에 실수 형태로 저장된다

5.000000000000000000e+00,7.000000000000000000e+00,9.000000000000000000e+00,8.000000000000000000e+00,6.000000000000000000e+00
5.000000000000000000e+00,2.000000000000000000e+00,5.000000000000000000e+00,5.000000000000000000e+00,9.000000000000000000e+00
9.000000000000000000e+00,7.000000000000000000e+00,8.000000000000000000e+00,6.000000000000000000e+00,6.000000000000000000e+00
8.000000000000000000e+00,9.000000000000000000e+00,5.000000000000000000e+00,1.000000000000000000e+00,2.000000000000000000e+00
9.000000000000000000e+00,1.000000000000000000e+00,8.000000000000000000e+00,4.000000000000000000e+00,7.000000000000000000e+00


In [281]:
csv = np.loadtxt('a.csv', delimiter = ',')
print(csv)

[[5. 7. 9. 8. 6.]
 [5. 2. 5. 5. 9.]
 [9. 7. 8. 6. 6.]
 [8. 9. 5. 1. 2.]
 [9. 1. 8. 4. 7.]]


In [284]:
print(b2)
np.savetxt('b.csv', b2, delimiter=',', fmt='%.2e', header='c1,c2,c3,c4,c5') # format을 다양하게 지정 가능하다

[[5 8 6 7 8]
 [6 1 3 2 6]
 [2 7 3 3 7]
 [4 3 6 4 6]
 [7 9 4 9 8]]


In [287]:
!cat b.csv

# c1,c2,c3,c4,c5
5.00e+00,8.00e+00,6.00e+00,7.00e+00,8.00e+00
6.00e+00,1.00e+00,3.00e+00,2.00e+00,6.00e+00
2.00e+00,7.00e+00,3.00e+00,3.00e+00,7.00e+00
4.00e+00,3.00e+00,6.00e+00,4.00e+00,6.00e+00
7.00e+00,9.00e+00,4.00e+00,9.00e+00,8.00e+00


In [288]:
csv = np.loadtxt('b.csv', delimiter=',')
print(csv)

[[5. 8. 6. 7. 8.]
 [6. 1. 3. 2. 6.]
 [2. 7. 3. 3. 7.]
 [4. 3. 6. 4. 6.]
 [7. 9. 4. 9. 8.]]




---

