<a href="https://colab.research.google.com/github/swhacademy/tensorflow-guide/blob/master/0_1_Numpy.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# numpy

- Python의 과학 컴퓨팅을 위한 핵심 라이브러리
- 고성능 다차원 배열 객체와 이러한 배열 작업을위한 도구를 제공

## Array 배열
- 속도가 느리고 메모리를 많이 차지하는 List의 대안
- 적은 메모리로 데이터를 빠르게 처리
- 모든 요소가 같은 자료형이며, 요소의 갯수를 바꿀 수 없다.
- 벡터와 행렬을 사용하는 선형대수 계산에 주로 사용

### 0. numpy모듈 임포트

In [0]:
import numpy as np

### 1. 1차원 배열

In [0]:
#@title 기본 제목 텍스트
a = np.array([1, 2, 3]) # rank = 1
print(type(a)) # ndarrayd은 N-dimensional Array의 약자
print(a.ndim) # 배열의 차원(Rank)
print(a.shape) # 배열의 크기
print(a[0], a[1], a[2]) # 인덱싱

<class 'numpy.ndarray'>
1
(3,)
1 2 3


###  2. 벡터화 연산
- 배열의 각 요소에 대한 반복 연산을 하나의 명령어로 처리

In [0]:
# List인 경우,
a = [1, 2, 3]
c = []
for b in a:
    c.append(2 * b)
print(c)
print(a * 2)

[2, 4, 6]
[1, 2, 3, 1, 2, 3]


In [0]:
# Array인 경우,
a = [1, 2, 3]
b = np.array(a)
c = b * 2
print(c)
print(c[2])

[2 4 6]
6


In [0]:
# 산술 연산 뿐만 아니라, 비교 연산과 논리 연산을 포함한 모든 종류의 수학 연산에 대해 적용
a = np.array([1, 2, 3])
# b = np.array([10, 20]) # Shape가 동일해야 가능
b = np.array([10, 20, 30])
c = 2 * a + b
print(c)
print(c / 2)
print(a == 2)
print(a > 2)
print(0 == (b % 10))

[12 24 36]
[ 6. 12. 18.]
[False  True False]
[False False  True]
[ True  True  True]


###  3. 2차원 배열
- 2차원 배열은 행렬(matrix)이라고 하는데 행렬에서는 가로줄을 행(row), 세로줄을 열(column)

In [0]:
a = np.array([[1, 2, 3], [4, 5, 6]])  # 2 x 3 배열
print(a)
print(a[0])
print(len(a), len(a[0])) # 행, 열의 갯수

[[1 2 3]
 [4 5 6]]
[1 2 3]
2 3


###  4. 3차원 배열
- 바깥쪽 리스트의 길이부터 가장 안쪽 리스트 길이의 순서로 표시

In [0]:
a = np.array([
    [[1, 2, 3], [4, 5, 6]], 
    [[7, 8, 9], [10, 11, 12]], 
    [[1, 2, 3], [4, 5, 6]], 
    [[7, 8, 9], [10, 11, 12]]
])  # 4 * 2 x 3 배열
print(a)
print(len(a), len(a[0]), len(a[0][0])) # Z, Y, Z 갯수

[[[ 1  2  3]
  [ 4  5  6]]

 [[ 7  8  9]
  [10 11 12]]

 [[ 1  2  3]
  [ 4  5  6]]

 [[ 7  8  9]
  [10 11 12]]]
4 2 3


### 5. 인덱싱

In [0]:
a = np.array([[1, 2, 3], [4, 5, 6]])
print(a)
print(a[0])
print(a[0,1]) # 첫 번째 행의 두 번째 열
print(a[0,-1]) # 첫 번째 행의 마지막 열

[[1 2 3]
 [4 5 6]]
[1 2 3]
2
3


##### 🔍 문제
- 위의 `a = np.array([[1, 2, 3], [4, 5, 6]])`로부터 이차원 배열 전체 요소을 아래와 같이 출력

1 2 3 4 5 6 

<details>
  <summary>Solution!</summary>
  
<pre>
a = np.array([[1, 2, 3], [4, 5, 6]])
for b in range(len(a)):
    for c in range(len(a[b])):
        print(a[b, c], end=" ")
</pre>
</details>

### 6. 슬라이싱

In [0]:
a = np.array([[1, 2, 3], [4, 5, 6]])
print(a[0, :]) # 첫 번째 행의 모든 열
print(a[1, 1:]) # 두 번째 행의 두 번째 열부터 끝까지
print(a[:, :2]) # 모든 행의 첫 번째 열부터 두 번째 열까지

[1 2 3]
[5 6]
[[1 2]
 [4 5]]


##### 🔍 문제
- 반복을 사용하여 아래의 리스트를 만든다.
[[1, 2, 3, 4], [5, 6, 7, 8], [9, 10, 11, 12], [13, 14, 15, 16], [17, 18, 19, 20]]
- `Array`을 사용하여 16을 인덱싱한다.
- `Array`을 사용하여 [7, 8]을 슬라이싱 한다. 

<details>
  <summary>Solution!</summary>
  
<pre>
a = []
b = []
for c in range(1, 21):
    b.append(c)
    if c % 4 == 0:
        a.append(b)
        b = []
print(a)
d = np.array(a)
print(d[3][-1])
print(d[1, 2:])
</pre>
</details>

### 7. 배열 인덱싱
- 대괄호안의 인덱스 정보로 숫자나 슬라이스가 아니라 위치 정보를 나타내는 또 다른 배열(인덱스 배열)을 넣는 경우
- 인덱스 배열에는 Boolean배열방식, 정수형 배열방식이 있다.
 - Boolean배열방식은 인덱스 배열의 원소가 True, False 두 값으로만 구성되며 인덱스 배열의 크기가 원래 ndarray 객체의 크기와 같다.
 - 정수형 배열방식은 인덱스 배열의 원소 각각이 원래 ndarray 객체 원소 하나를 가리키는 인덱스 정수

In [0]:
a = np.array([10, 11, 12, 13, 14, 15, 16, 17, 18, 19])

In [0]:
# Boolean형 배열방식
b = np.array([True, False, True, False, True,
                False, True, False, True, False])
print(a[b])
print(a % 2)
print(a % 2 == 0)
print(a[a % 2 == 0])

[10 12 14 16 18]
[0 1 0 1 0 1 0 1 0 1]
[ True False  True False  True False  True False  True False]
[10 12 14 16 18]


In [0]:
# 정수형 배열방식
c = np.array([1, 3, 5, 7, 9])
d = np.array([1, 1, 0, 0, 4, 4, 1, 1, 1, 1, 1, 1, 1]) # 배열 인덱스가 원래의 배열보다 클 수 있다.
print(a[c])
print(a[d])

[11 13 15 17 19]
[11 11 10 10 14 14 11 11 11 11 11 11 11]


In [0]:
# 배열 인덱싱은 다차원 배열의 각 차원에 대해서도 가능
e= np.array([[1, 2, 3, 4], [5, 6, 7, 8]])
print(a[e])
print(e[:, [True, False, False, True]])

[[11 12 13 14]
 [15 16 17 18]]
[[1 4]
 [5 8]]


##### 🔍 문제
z = np.array([1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15])

- 이 배열에서 3의 배수를 찾아라.
- 이 배열에서 3으로 나누면 나누어지고 4로 나누면 2가 남는 수를 찾아라.

<details>
  <summary>Solution!</summary>
  
<pre>
z = np.array([1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15])
print(z[z % 3 == 0])
print(z[(z % 3 == 0) & (z % 4 == 2)])
</pre>
</details>

### 8. 연산
- +, -, *, / 등의 연산자를 사용
- add(), substract(), multiply(), divide() 등의 함수를 사용

In [0]:
a = np.array([1,2])
b = np.array([3,4])
 
# 각 요소 더하기
c = a + b
# c = np.add(a, b)
print(c)
 
# 각 요소 빼기
c = a - b
# c = np.subtract(a, b)
print(c)
 
# 각 요소 곱하기
# c = a * b
c = np.multiply(a, b)
print(c)
 
# 각 요소 나누기
# c = a / b
c = np.divide(a, b)
print(c)

[4 6]
[-2 -2]
[3 8]
[0.33333333 0.5       ]


In [0]:
# vector와 matrix의 product을 연산
a = np.array([[1,2],[3,4]])
b = np.array([[5,6],[7,8]])
c = np.dot(a, b)
print(c)

[[19 22]
 [43 50]]


In [0]:
a = np.array([[1,2],[3,4]])
s = np.sum(a)
print(s)   # 각 요소의 합
 
# axis=0 이면, 컬럼끼리 더함
# axis=1 이면, 행끼리 더함
s = np.sum(a, axis=0)
print(s)
s = np.sum(a, axis=1)
print(s)

s = np.prod(a)
print(s)   # 각 요소의 곱

10
[4 6]
[3 7]
24
