# **Chapter 5. Numpy 함수 심화 - 1**

   - Numpy는 그 이름의 유래에서도 알 수 있듯이 대량의 숫자 데이터를 배열(array)을 통해 생성 및 변환 등을 빠르고 손쉽게 할 수 있는 파이썬 패키지임을 살펴보았습니다.
   - 이제부터는 이러한 **데이터 간 연산과 특정 형태로의 수정** 등을 할 수 있는 Numpy 내장 연산 함수들을 살펴보겠습니다.

![4numpy_1-1.jpg](attachment:30d76948-6bdb-4aca-9c53-842ff5fe1f04.jpg)

#### 아래 그림은 2개의 1차원 숫자 데이터끼리 다양한 방식으로 병합하는 연산, 그리고 데이터의 특정 축(axis) 방향으로의 합이나 평균을 구하는 연산을 보여주고 있습니다. 
#### 이처럼 데이터를 다룰 때는 데이터를 병합하거나 특정한 방식으로 원하는 연산을 해야할 때가 많습니다.

![Numpy 5-1.png](attachment:824c1ed9-168a-494c-b021-5fbd6455242b.png)

#### 배열(array)로 이루어진 데이터들도 위와 같은 작업이 필요한 경우가 많이 있습니다. 이제부터는 배열 간 연산에 많이 활용되는 함수들을 알아보겠습니다.

   - Chapter 3에서 다루는 함수는 다음과 같습니다.
        1. sum, mean, sqrt, power: 배열 안에 있는 요소들의 모든 합, 평균, 제곱근, 거듭제곱 등을 구해줍니다.
        2. dot product, vector product: 두 배열 간의 내적과 외적을 구합니다.
        3. concat, hstack, vstack, dstack: 두 배열을 특정 축으로 합해줍니다.
        4. broadcasting: 배열 간의 사칙연산에는 브로드캐스팅(Broadcasting)이라는 기법이 활용됩니다.
        5. all, any: 배열 간의 비교 연산을 해주는 함수입니다. 기본적으로 불리언(boolean)으로 배열 간 비교 연산의 결과값이 주어집니다.(*boolean: True, False 데이터 타입)
        6. min, max, argmax, argmin: 배열 안에 있는 숫자들의 대소 비교를 해줍니다.
        7. load, loadtxt, save: 숫자 데이터를 배열로 저장하거나 불러올 수 있습니다

### 1. sum 함수 활용하기
np.sum 함수는 배열 내의 모든 원소들의 합을 구해줍니다. 
> 활용 방법: arr = arr.sum() or arr = np.sum(arr)

In [7]:
# 예제 1 : sum 함수를 활용해 1차원 배열의 합을 구해보기
import numpy as np

arr = np.array([1,2,3,4,5])
print("- 배열: ", arr)
arr_sum = np.sum(arr)
print("- 합: ", arr_sum)

arr = np.arange(1, 101, 1) # 1~100까지 1간격의 1차원 배열을 생성합니다. 
print("- 배열: ", arr)
arr_sum = np.sum(arr)
print("- 합: ", arr_sum)

- 배열:  [1 2 3 4 5]
- 합:  15
- 배열:  [  1   2   3   4   5   6   7   8   9  10  11  12  13  14  15  16  17  18
  19  20  21  22  23  24  25  26  27  28  29  30  31  32  33  34  35  36
  37  38  39  40  41  42  43  44  45  46  47  48  49  50  51  52  53  54
  55  56  57  58  59  60  61  62  63  64  65  66  67  68  69  70  71  72
  73  74  75  76  77  78  79  80  81  82  83  84  85  86  87  88  89  90
  91  92  93  94  95  96  97  98  99 100]
- 합:  5050


또한, np.sum은 N차원 이상의 배열에서 특정 축(axis)을 기준으로 합을 구할 수 있습니다.
(깊이, 행, 열) 순으로 이루어진 3차원 배열에서 축은 각각 0, 1, 2입니다. 
> 활용 방법: arr = arr.sum(axis=0) or arr = np.sum(arr, axis=0) --> 0번 축으로 합을 구합니다

![4numpy_2-1-1.jpg](attachment:9ad3f8a2-694c-407e-9936-6f36c82c7cc3.jpg)

위와 같은 3차원 배열이 있다고 해보겠습니다. 위 배열은 (3, 3, 4)의 형태를 가지고 있습니다. 위의 배열을 아래의 명령어를 통해 생성해보겠습니다.

    arr = np.array([[[1,2,3,4],[5,6,7,8],[9,10,11,12]], 
              [[1,2,3,4],[5,6,7,8],[9,10,11,12]],
              [[1,2,3,4],[5,6,7,8],[9,10,11,12]]])

In [None]:
# 예제 2 : sum 함수를 활용해 다차원 배열의 합을 구해보기

# (3, 3, 4) 배열 생성
arr = np.array([[[1,2,3,4],[5,6,7,8],[9,10,11,12]], 
              [[1,2,3,4],[5,6,7,8],[9,10,11,12]],
              [[1,2,3,4],[5,6,7,8],[9,10,11,12]]])

# shape 배열 형태 확인
print(arr.shape)

# 0, 1, 2 축 기준으로 더하기  
arr_sum = arr.sum(axis=0)  # 0번 축, 즉 깊이(가장 바깥 배열)의 합을 구하여 변수에 저장해줍니다. 
print("0번 축을 기준으로 더하기: \n", arr_sum) 

> 위 결과와 그림에 나와있는 배열의 형태를 살펴보면 0번 축(axis=0)으로 더한 결과가 나온 것임을 확인할 수 있습니다.  
  예를 들어 첫번째 행인 [3, 6, 9, 12]는 [1, 2, 3, 4]를 3번 더한 결과입니다.
  위에서 생성한 3차원 배열을 [[1,2,3,4],[5,6,7,8],[9,10,11,12]] 라는 2차원 배열이 3장 겹쳐있는 타일로 생각해보세요.   
  그렇다면 깊이를 더했을 때, 그 겹쳐진 수들을 더해주면 되기 때문에, 1+1+1이 한 타일, 2+2+2, 3+3+3., 4+4+4까지 하면 한 행의 깊이를 더한 것이 됩니다.  
  그림을 그려 생각해보면 더 쉽게 이해할 수 있을 겁니다. 
  
> 다음은 axis=1, aixs=2 방향으로 더한 결과를 확인해보겠습니다.

In [None]:
arr_sum = arr.sum(axis=1) 
print("1번 축을 기준으로 더하기: \n", arr_sum)  # 1번 축, 즉 행을 기준으로 더해줍니다. 
arr_sum = arr.sum(axis=2) 
print("2번 축을 기준으로 더하기: \n", arr_sum)  # 2번 축, 즉 열을 기준으로 더해줍니다. 

> 3차원 배열의 그림을 그렸을 때, 좌상단에서 좌하단으로 내려오는 방향이 1번 축입니다.  
따라서 그 방향을 따라 왼쪽부터 차례로 더해주면 어렵지 않게 1번 축을 기준으로 더한 값을 구할 수 있습니다.   
> 2번 축은 좌상단에서 우상단으로, 즉 오른쪽으로 이동하는 방향입니다.   
따라서 그 방향을 따라 위에서부터 차례로 더해주면 2번 축을 기준으로 더한 값을 구할 수 있습니다.   

### 2.mean 함수 활용하기
np.mean 함수는 요소의 평균을 구해줍니다. 
> 활용 방법: arr = arr.mean or arr = np.mean(arr) 

평균이란 모든 요소의 합을 요소의 개수로 나눈 것과 동일하므로 아래와 같은 관계가 성립합니다. (참고: arr.size는 arr의 요소 개수를 구합니다)
> np.mean(arr) == np.sum(arr) / arr.size


In [9]:
# 예제 3 : mean 함수를 활용하여 배열의 평균을 구해보기
arr = np.array([1,2,3,4,5,6,7,8,9])

print("배열\n:",arr)
print("평균 구하기\n:", np.mean(arr))
print("sum과 size를 활용하여 평균 구하기\n:", np.sum(arr)/arr.size)

arr = np.arange(-5, 6, 1) # -5부터 5까지의 배열 생성

print("배열\n:",arr)
print("평균 구하기\n:", np.mean(arr))
print("sum과 size를 활용하여 평균 구하기\n:", np.sum(arr)/arr.size)

배열
: [1 2 3 4 5 6 7 8 9]
평균 구하기
: 5.0
sum과 size를 활용하여 평균 구하기
: 5.0
배열
: [-5 -4 -3 -2 -1  0  1  2  3  4  5]
평균 구하기
: 0.0
sum과 size를 활용하여 평균 구하기
: 0.0


> np.mean 역시 sum과 마찬가지로 특정 방향의 축(axis)으로 평균을 구할 수 있습니다. 아래와 같은 2차원 배열을 만들어, 서로 다른 축으로 mean을 구해보겠습니다.
앞선 3차원 배열의 축과 마찬가지로 2차원 배열의 축도 (행, 열) 각각 (0, 1)번 축입니다. 
따라서 배열의 그림을 그렸을 때, 0번 축은 좌상단에서 좌하단, 1번 축은 좌상단에서 우상단으로의 방향으로 평균을 구해줍니다.    
    arr = np.array([[1, 3], [5, 7]])

In [None]:
# 예제 4 : mean 함수를 활용하여 특정 축(axis) 방향으로 평균을 구해보기

# (2, 2) 배열 생성
arr = np.array([[1, 3], [5, 7]])

print("배열\n:",arr)
print("배열 요소의 평균\n:", np.mean(arr))
print("0번 axis방향의 평균 구하기\n:", np.mean(arr, axis=0)) # 1과 5, 3과 7의 각각의 평균인 3, 5가 결과로 나옵니다
print("1번 axis방향의 평균 구하기\n:", np.mean(arr, axis=1)) # 1과 3, 5과 7의 각각의 평균인 2, 6가 결과로 나옵니다

# (3, 3) 배열 생성

arr = np.array([[1, 3, 5], [9, 11, 13]])

print("배열\n:",arr)
print("배열 요소의 평균\n:", np.mean(arr))
print("0번 axis방향의 평균 구하기\n:", np.mean(arr, axis=0)) # 1과 9, 3과 11, 5와 13의 각각의 평균인 [5, 7, 9]가 결과로 나옵니다
print("1번 axis방향의 평균 구하기\n:", np.mean(arr, axis=1)) # 1, 3, 5의 평균과 5,7,9의 평균인 [3, 11]이 결과로 나옵니다

### 2. 여러 배열을 병합하기

>vstack : 배열을 axis=0방향으로 병합합니다. ex) np.vstack((arr, arr))</br> 
hstack : 배열을 axis=1방향으로 병합합니다. ex) np.hstack((arr, arr))</br>
dstack : 배열을 axis=2방향으로 병합합니다. ex) np.dstack((arr, arr))

>concatenate : 배열을 사용자가 지정한 방향으로 병합합니다. ex) np.concatenate((arr, arr), axis=2)

concatenate 함수는 특정 axis를 부여할 수 있으므로 axis를 0, 1, 2로 설정하면 각각 vstack, hstack, dstack과 혼용하여 활용할 수 있습니다.

![Numpy 5-2.png](attachment:f6c6508d-8791-4783-8708-530fa9482748.png)

#### 위 그림과 동일한 두 개 배열의 병합을 구해보겠습니다.

In [None]:
# 예제 5 : hstack, vstack, dstack 함수를 활용하여 두 배열을 병합해보기

arr_1 = np.arange(0, 9).reshape(3, 3)
arr_2 = 10*np.arange(0, 9).reshape(3, 3)
print("배열 1:\n", arr_1)
print("배열 2:\n", arr_2)

vstack_arr = np.vstack((arr_1, arr_2)) # 0번 축으로 두 배열을 합치기 
print("\nvstack을 수행한 배열 확인:\n", vstack_arr)
print("\nvstack을 수행한 배열 형태 확인: ", vstack_arr.shape)

hstack_arr = np.hstack((arr_1, arr_2)) # 0번 축으로 두 배열을 합치기 
print("\nhstack을 수행한 배열 확인:\n", hstack_arr)
print("\nhstack을 수행한 배열 형태 확인: ", hstack_arr.shape)

dstack_arr = np.dstack((arr_1, arr_2)) # 0번 축으로 두 배열을 합치기 
print("\ndstack을 수행한 배열 확인:\n", dstack_arr)
print("\ndstack을 수행한 배열 형태 확인: ", dstack_arr.shape)

In [None]:
# 예제 6 : concatenate 함수를 활용하여 두 배열을 병합해보기

k = 0 # axis 설정
concat_arr = np.concatenate((arr_1, arr_2) ,axis=k) # 붙이는 축을 사용자가 임의로 정하기 (k)
print("0번 axis로(k=0) concatenate을 수행한 배열:\n", concat_arr)

vstack_arr = np.vstack((arr_1, arr_2))
print("vstack을 수행한 배열:\n", vstack_arr) # concatenate과 동일한 결과를 확인할 수 있습니다.

k = 1 # axis 설정
concat_arr = np.concatenate((arr_1, arr_2) ,axis=k) # 붙이는 축을 사용자가 임의로 정하기 (k)
print("\n1번 axis(k=1)로 concatenate을 수행한 배열:\n", concat_arr)

hstack_arr = np.hstack((arr_1, arr_2))
print("hstack을 수행한 배열:\n", hstack_arr) # concatenate과 동일한 결과를 확인할 수 있습니다.

> 위처럼 2개 배열을 합할 수도 있지만 3개 이상의 배열을 한번에 병합할 수도 있습니다.</br></br>
ex) np.concatenate((arr, arr, arr), axis=0)

In [None]:
# 예제 7 : stack과 concatenate 함수를 활용하여 3개 이상의 배열을 병합해보기

arr_1 = np.array(([1,2], [3,4]))
arr_2 = np.array(([10,20], [30,40]))
arr_3 = np.array(([100,200], [300,400]))
print("배열 1:\n", arr_1)
print("배열 2:\n", arr_2)
print("배열 2:\n", arr_3)

hstack_arr = np.hstack((arr_1, arr_2, arr_3)) # 0번 축으로 두 배열을 합치기 
print("\nhstack을 수행한 배열 확인:\n", hstack_arr)
print("\nhstack을 수행한 배열 형태 확인: ", hstack_arr.shape)

concat_arr = np.concatenate((arr_1, arr_2, arr_3), axis=1)
print("\n1번 axis로 concatenate을 수행한 배열:\n", concat_arr)