<a href="https://colab.research.google.com/github/moseskim/twitter_bot/blob/master/python_basic/03_numpy.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# NumPy 기초

NumPy는 파이썬의 확장 모듈로 간단한 표기로 효율적으로 데이터를 조작할 수 있게 합니다.  
다차원 배열을 효과적으로 지연하고, 내부는 C 언어로 구현되어 있어 속도가 빠릅니다.  
NumPy에는 다양한 기능이 있습니다. 여기에서는 이번 강좌에서 사용하는 범위에 한해 설명합니다.

## ● Numpy 도입

파이썬에서는 `import` 기술을 사용해 모듈을 로드할 수 있습니다.  
NumPy는 모듈이므로 NumPy를 사용하려면 코드 앞 부분에 다음과 같이 기술해야 합니다.

In [None]:
import numpy as np

`as`를 사용해 모듈에 다른 이름을 붙일 수 있습니다.  
이렇게 기술한 뒤에는 `np`라는 이름으로 NumPy 모듈을 사용할 수 있습니다.

## ● Numpy의 배열

인공지능의 계사에는 베터나 행결을 많이 사용합니다. 이들을 표현할 때 NumPy 배열을 사용합니다.  
벡터나 행렬에 관해서는 이후 섹션에서 다시 설명합니다. 여기에서는 우선 NumPy의 배열이란 수치를 겹쳐서 배열한 것이라고 생각하면 충분합니다.  
이후 배열이라 부르는 경우에는 NumPy의 배열을 가리킵니다.

NumPy의 배열은 NumPy의 `array` 함수를 사용해 파이썬의 리스트로부터 간단하게 만들 수 있습니다.

In [None]:
import numpy as np

a = np.array([0, 1, 2, 3, 4, 5])  # Python의 리스트로부터 NumPy의 배열을 만든다
print(a)

이런 배열이 겹쳐진 2차원 배열을 만들 수도 있습니다.  
2차원 배열은 요소가 리스트인 리스트(2중 리스트)로부터 만듭니다.

In [None]:
import numpy as np

b = np.array([[0, 1, 2], [3, 4, 5]])  # 2중 리스트로부터 NumPy의 2차원 배열을 만든다
print(b)

마찬가지로 3차원 배열도 만들 수 있습니다.  
3차원 배열은 2차원 배열을 한번 더 겹친 것으로, 3중 리스트로부터 만듭니다.

In [None]:
import numpy as np

c = np.array([[[0, 1, 2], [3, 4, 5]], [[5, 4, 3], [2, 1, 0]]])  # 3중 리스트로부터 NumPy의 3차원 배열을 만든다.
print(c)

## ● 배열의 연산

다음 예에서는 배열과 수치 사이의 연산을 수행합니다.  
이때, 배열의 각 요소와 수치 사이에서 연산이 수행됩니다.

In [None]:
import numpy as np

a = np.array([[0, 1, 2], [3, 4, 5]])  # 2차원 배열
print(a)
print()
print(a + 3)  # 각 요소에 3을 더한다
print()
print(a * 3)  # 각 요소에 3을 곱한다

다음은 배열 간 연산의 예입니다.  
이 경우에는 같은 위치의 각 요소끼리 연산이 수행됩니다.

In [None]:
b = np.array([[0, 1, 2], [3, 4, 5]])  # 2차원 배열
c = np.array([[2, 0, 1], [5, 3, 4]])  # 2차원 배열

print(b)
print()
print(c)
print()
print(b + c)
print()
print(b * c)

브로드캐스트 기능을 사용해, 특정한 조건을 만족하면 형태가 다른 배열 간 연산을 할 수 있습니다.

In [None]:
d = np.array([[1, 1],
              [1, 1]])  # 2차원 배열
e = np.array([1, 2])  # 1차원 배열

print(d + e)

브로드캐스트의 자세한 규칙은 다소 복잡해 모두 기술하면 길이가 길어지므로, 여기에서는 필요한 최소한의 설명만 했습니다.

## ● 형태 변환

NumPy의 `shape` 메서드를 사용해 배열의 형태를 얻을 수 있습니다.

In [None]:
import numpy as np

a = np.array([[0, 1, 2],
            [3, 4, 5]])

print(a.shape)

`reshape` 메서드를 사용하면 배열의 형태를 변환할 수 있습니다.  
다음 예에서는 요소 수가 8인 1차원 배열을, 형태가 (2, 4)인 2차원 배열로 변환합니다.

In [None]:
b = np.array([0, 1, 2, 3, 4, 5, 6, 7])    # 배열 작성
c = b.reshape(2, 4)                       # (2, 4)인 2차원 배열로 변환
print(c)

`reshape`의 인수를 `-1`로 하면 모든 형태의 배열을 1차원 배열로 변환할 수 있습니다.

In [None]:
d = np.array([[[0, 1, 2],
                   [3, 4, 5]],

                  [[5, 4, 3],
                   [2, 1, 0]]])  # 3중 리스트로부터 NumPy의 3차원 배열을 만든다


e = d.reshape(-1)
print(e)

## ● 요소로의 접근

배열의 각 요소로의 접근은 리스트와 마찬가지로 인덱스를 이용합니다.  
1차원 배열의 경우, 다음과 같이 `[ ]`안에 인덱스를 지정해, 요소를 꺼낼 수 있습니다.

In [None]:
import numpy as np

a = np.array([0, 1, 2, 3, 4, 5])
print(a[2])

여기에서는 앞에서 0, 1, 2...로 인덱스를 붙인 경우, 인덱스가 2인 요소를 꺼냈습니다.  
그리고 리스트에서와 마찬가지로 인덱스를 지정해 요소를 교체할 수 있습니다.

In [None]:
a[2] = 9
print(a)

여기에서는 인덱스가 2인 요소를 9로 치환했습니다.

2차원 배열에서 요소를 꺼낼 때는 인덱스를 세로, 가로로 2개 지정합니다.  
`,`{콤마) 구분자로 인덱스를 나열할 수 있으며, 인덱스를 넣은 `[ ]`를 2개 나열할 수도 있습니다.

In [None]:
b = np.array([[0, 1, 2],
              [3, 4, 5]])

print(b[1, 2])  # b[1][2]과 같다

세로 인덱스가 1, 가로 인덱스가 2인 요소를 꺼냈습니다.  
요소를 교체할 때도 마찬가지로 인덱스를 2개 지정합니다.

In [None]:
b[1, 2] = 9

print(b)

2개의 인덱스로 지정한 요소를 교체했습니다.  
3차원 이상의 배열에서도 이와 마찬가지로 인덱스를 여럿 지정해서 요소에 접근할 수 있습니다.

## ● 함수와 배열

함수의 인수와 반환값으로 NumPy 배열을 사용할 수 있습니다.  
다음함수 `my_func`는 인수로 배열을 받고 반환값으로 배열을 반환합니다.

In [None]:
import numpy as np

def my_func(x):
    y = x * 2 + 1
    return y

a = np.array([[0, 1, 2],
              [3, 4, 5]])  # 2차원 배열
b = my_func(a)  # 인수로 배열을 전달한다

print(b)

## ● NumPy의 다양한 기능

`sum`으로 합계, `average`으로 평균, `max`으로 최댓값, `min`으로 최솟값을 얻을 수 있습니다.

In [None]:
import numpy as np

a = np.array([[0, 1, 2],
              [3, 4, 5]])  # 2차원 배열

print(np.sum(a))
print(np.average(a))
print(np.max(a))
print(np.min(a))

인수에 `axis`를 지정하면 특정한 방향으로 연산을 수행할 수 있습니다.

In [None]:
import numpy as np

b = np.array([[0, 1, 2],
              [3, 4, 5]])  # 2차원 배열

print(np.sum(b, axis=0))  # 세로 방향으로 합계
print(np.sum(b, axis=1))  # 가로 방향으로 합계