# Numpy Basic

Numpy는 수치 계산을 위한 핵심 라이브러리로서, 배열(array)을 중심으로 다양한 연산과 처리를 수행할 수 있습니다.

다음은 Numpy의 기초부터 응용까지에 대한 상세한 설명과 실습 코드 예제입니다.

In [None]:
#@title Numpy 라이브러리 불러오기

import numpy as np

## 배열 생성
- numpy.array(): 리스트나 튜플로부터 배열을 생성
- numpy.zeros(), numpy.ones(), numpy.empty(): 주어진 형태와 타입의 새 배열을 생성하며, 초기화하지 않거나 0, 1로 초기화
- numpy.arange(), numpy.linspace(): 연속적인 값들로 구성된 배열 생성
- numpy.random.random(): 무작위 값들로 구성된 배열 생성

#### 배열의 모양
![배열의 모양](https://github.com/jphan32/CVTrack-Tutorials/blob/main/resources/nparr1.png?raw=true)

#### 용어의 정리
- 벡터(Vector): 1차원 배열
- 행렬(Matrix): 2차원 배열
- 텐서(Tensor): 3차원 이상의 배열을 포함하여, 벡터와 행렬을 포괄하는 일반적인 용어

In [None]:
a = np.array([7, 2, 9, 10])
b = np.zeros((2, 3))
c = np.ones((4, 3, 2))
d = np.empty((2, 2))
e = np.arange(10, 30, 5) # numpy.arange ([start, ]stop, [step, ]dtype=None)
f = np.linspace(0, 2, 9) # numpy.linspace(start, stop, num=50, endpoint=True, retstep=False, dtype=None, axis=0)
g = np.random.random((2,2))

print(f"a: {a}\n") # 1차원 배열
print(f"b: {b}\n") # shape 지정 + zero
print(f"c: {c}\n") # shape 지정 + one
print(f"d: {d}\n") # shape 지정
print(f"e: {e}\n") # 주어진 간격에 따라 균일한 값들의 배열
print(f"f: {f}\n") # 지정된 수의 균일하게 간격을 둔 숫자를 생성한 배열
print(f"g: {g}\n") # shape 지정 + random

## 배열 조작
- reshape(): 배열의 형태 변경
- flatten(): 배열을 1차원으로 평평하게 만듦
- concatenate(), vstack(), hstack(): 배열 합치기
- split(), vsplit(), hsplit(): 배열 분리

In [None]:
a = np.random.random((4, 2))
print(a)
print(f"shape: {a.shape}")

In [None]:
reshaped = a.reshape(1, 2, 4)
print(reshaped)
print(f"shape: {reshaped.shape}")

In [None]:
flattened = a.flatten()
print(flattened)
print(f"shape: {flattened.shape}")

In [None]:
b = np.random.random((4, 2))
print(b)
print(f"shape: {b.shape}")

#### 배열을 합치거나 분리할때 주의사항
- 가능한 조건: 연결하려는 축을 제외한 나머지 차원의 크기가 동일해야 합니다.
- 불가능 조건: 연결하려는 축을 제외한 나머지 차원의 크기가 다르면 합칠 수 없습니다.

#### axis 축
![axis 축](https://github.com/jphan32/CVTrack-Tutorials/blob/main/resources/nparr2.jpg?raw=true)

In [None]:
concatenated = np.concatenate((a, b), axis=0)
print(concatenated)
print(f"shape: {concatenated.shape}")

In [None]:
vstack = np.vstack((a, b))
print(vstack)
print(f"shape: {vstack.shape}")

In [None]:
hstack = np.hstack((a, b))
print(hstack)
print(f"shape: {hstack.shape}")

In [None]:
split = np.split(a, 2, axis=0)
for s in split:
  print(s)
  print(f"shape: {s.shape}")
  print('')

In [None]:
vsplit = np.vsplit(a, 2)
for s in vsplit:
  print(s)
  print(f"shape: {s.shape}")
  print('')

In [None]:
hsplit = np.hsplit(a, 2)
for s in hsplit:
  print(s)
  print(f"shape: {s.shape}")
  print('')

## 인덱싱과 슬라이싱
- 인덱싱 : 인덱싱은 배열의 특정 요소에 액세스하기 위해 사용됩니다.
- 슬라이싱 : 슬라이싱은 배열의 부분 집합을 추출하기 위해 사용됩니다.

In [None]:
# 1차원 배열 생성
arr1d = np.array([1, 2, 3, 4, 5])
print("1D array:", arr1d[2])

In [None]:
# 2차원 배열 생성
arr2d = np.array([[1, 2, 3],
                  [4, 5, 6],
                  [7, 8, 9]])
print("2D array:", arr2d[1, 2])

In [None]:
# 1차원 배열 생성
arr1d = np.array([1, 2, 3, 4, 5])
print("1D slice:", arr1d[1:4])

In [None]:
# 2차원 배열 생성
arr2d = np.array([[1, 2, 3],
                  [4, 5, 6],
                  [7, 8, 9]])
print("2D slice:", arr2d[0:2, 1:3])

In [None]:
#@title [문제] 요구에 맞게 행렬 인덱싱과 슬라이싱

import numpy as np

# 2차원 배열 생성
arr = np.array([[1, 2, 3, 4],
                [5, 6, 7, 8],
                [9, 10, 11, 12]])

# 특정 요소 인덱싱
element = arr[ CODE_HERE ]  # 7
print("Indexed element:", element)

# 행 인덱싱
row = arr[ CODE_HERE ]  # [5, 6, 7, 8]
print("Indexed row:", row)

# 열 인덱싱
column = arr[ CODE_HERE ]  # [3, 7, 11]
print("Indexed column:", column)

# 부분 배열 슬라이싱
sub_array = arr[ CODE_HERE ]  # [[2, 3], [6, 7]]
print("Sliced sub-array:\n", sub_array)

## 유니버설 함수
[NumPy API Reference: Universal functions](https://numpy.org/doc/stable/reference/ufuncs.html)

유니버설 함수(Universal Functions, ufuncs)는 NumPy에서 제공하는, 배열의 각 요소에 대해 연산을 수행하는 함수입니다. 유니버설 함수는 C 또는 C++로 구현되어 있어 높은 성능을 제공하며, 벡터화 연산을 수행하여 루프 없이 전체 배열에 대한 빠른 연산을 가능하게 합니다. 이는 대규모 데이터 세트에 대한 수학적 연산을 효율적으로 수행할 수 있게 해줍니다.

### 유니버설 함수의 특징
- 벡터화(Vectorization): 유니버설 함수는 배열의 각 요소에 대해 연산을 수행하므로, Python의 기본 루프보다 훨씬 빠른 성능을 제공합니다.
- 타입 캐스팅(Type Casting): 유니버설 함수는 연산 결과를 저장할 적절한 출력 데이터 타입을 자동으로 결정합니다.
- 출력 지정(Output Specification): 유니버설 함수는 연산 결과를 저장할 기존 배열을 지정할 수 있습니다, 이를 통해 메모리 할당을 최적화할 수 있습니다.
- 데이터 유형(Data Type): 유니버설 함수는 다양한 데이터 유형에 대해 연산을 수행할 수 있습니다.

In [None]:
# 배열 생성
arr1 = np.array([1, 2, 3, 4])
arr2 = np.array([5, 6, 7, 8])

# 유니버설 함수 사용 예제
result_add = np.add(arr1, arr2)  # 배열의 덧셈
result_subtract = np.subtract(arr1, arr2)  # 배열의 뺄셈
result_multiply = np.multiply(arr1, arr2)  # 배열의 곱셈
result_divide = np.divide(arr1, arr2)  # 배열의 나눗셈

print(f"add: {result_add}")
print(f"subtract: {result_subtract}")
print(f"multiply: {result_multiply}")
print(f"divide: {result_divide}")

In [None]:
result_add = np.add(arr1, 5)
print(f"add: {result_add}")

In [None]:
result_add = np.add(arr1, [[5], [6], [7], [8]])
print(f"add: {result_add}")

In [None]:
# 다른 유니버설 함수 예제
result_exp = np.exp(arr1)  # 지수 함수
result_log = np.log(arr1)  # 로그 함수
result_sqrt = np.sqrt(arr1)  # 제곱근 함수

print(f"exp: {result_exp}")
print(f"log: {result_log}")
print(f"sqrt: {result_sqrt}")

## 행렬의 내적
행렬에서의 곱은 (dot product) 내적이라고 합니다.

𝑥 ⋅ 𝑤 = 𝑦

이를 코드로는 다음과 같이 표기할 수 있습니다.
```python
y = x @ w
```

![행렬의 내적](https://github.com/jphan32/CVTrack-Tutorials/blob/main/resources/arr_multiply.png?raw=true)

In [None]:
print(f"arr1: {arr1}")
print(f"arr2: {arr2}")

In [None]:
#result_multiply = np.multiply(arr1, arr2)

result_multiply = arr1 @ arr2
print(f"multiply: {result_multiply}")

In [None]:
result_multiply = np.dot(arr1, arr2)
print(f"multiply: {result_multiply}")

### 행렬 연산의 차이 자세히 알아보기
#### 행렬의 덧셈
- 행렬 덧셈은 두 행렬의 같은 위치에 있는 요소들끼리 더하는 연산입니다.
- 두 행렬 A와 B의 덧셈은 A와 B가 동일한 차원을 가져야 하며, 결과 행렬 C의 각 요소 c_ij는 a_ij + b_ij로 계산됩니다.
```plaintext
A = | 1 2 |      B = | 4 5 |      A + B = | (1+4) (2+5) |
      | 3 4 |          | 6 7 |              | (3+6) (4+7) |
```

#### 행렬의 곱셈
- 엄밀하게는, 요소별 곱셈을 나타내기 위해 "element-wise multiplication" 이라고 명확히 부를 수 있습니다.
- 행렬의 곱셈은 두 행렬의 같은 위치에 있는 요소들끼리 곱하는 연산입니다.
- 두 행렬 A와 B의 곱셈은 A와 B가 동일한 차원을 가져야 하며, 결과 행렬 C의 각 요소 c_ij는 a_ij * b_ij로 계산됩니다.
```plaintext
A = | 1 2 |      B = | 4 5 |      A ⊙ B = | (1*4) (2*5) |
      | 3 4 |          | 6 7 |              | (3*6) (4*7) |
```

#### 행렬의 내적
- 종종 행렬의 내적 (matrix dot product)은 행렬의 곱셈(matrix multiplication)이라고도 불립니다.
- 행렬의 내적은 첫 번째 행렬의 각 행과 두 번째 행렬의 각 열 간의 내적을 계산하는 연산입니다.
- 첫 번째 행렬 A의 열의 수와 두 번째 행렬 B의 행의 수가 일치해야 하며, 결과 행렬 C의 각 요소 c_ij는 a_i의 행과 b_j의 열의 내적으로 계산됩니다.
```plaintext
A = | 1 2 |      B = | 4 5 |      A @ B = | (1*4 + 2*6) (1*5 + 2*7) |
      | 3 4 |          | 6 7 |              | (3*4 + 4*6) (3*5 + 4*7) |
```

## 행렬 전치
- 행렬의 전치(transpose)는 행렬의 행과 열을 바꾸는 연산입니다.
- NumPy에서는 numpy.transpose 함수 또는 ndarray.T 속성을 사용하여 행렬의 전치를 수행할 수 있습니다.

In [None]:
# 3x2 행렬 생성
matrix = np.array([[1, 2], [3, 4], [5, 6]])
print("Original Matrix:\n", matrix)

# 행렬 전치
transposed_matrix = np.transpose(matrix)
print("\nTransposed Matrix:\n", transposed_matrix)

In [None]:
# 3x2 행렬 생성
matrix = np.array([[1, 2], [3, 4], [5, 6]])
print("Original Matrix:\n", matrix)

# 행렬 전치
transposed_matrix = matrix.T
print("\nTransposed Matrix:\n", transposed_matrix)

In [None]:
#@title [문제] 행렬의 전치를 이용하여 내적 계산하기

# 두 개의 3차원 벡터 생성
vector_a = np.random.rand(3, 2)  # 3x2 벡터
vector_b = np.random.rand(3, 2)  # 3x2 벡터

# 벡터_a의 전치를 사용하여 벡터_a와 벡터_b의 내적 계산
dot_product = CODE_HERE # (2x3) dot (3x2) -> 2x2 매트릭스
print("Dot Product:\n", dot_product)

## Numpy로 행렬 내적 연산 하기

다음과 같은 입력 레이어와 히든 레이어, 출력 레이어가 있다고 하였을 때

이를 Numpy의 내적 연산을 이용하여 출력을 구해보세요.

![MNIST MLP 구조](https://github.com/jphan32/CVTrack-Tutorials/blob/main/resources/mnist_mlp.jpg?raw=true)

In [None]:
#@title [문제] MNIST MLP 구조 만들어보기

# 784차원의 입력 벡터 생성
x = np.random.rand(784, 1)  # 예를 들어, 랜덤 값으로 초기화
print(f"x shape: {x.shape}")

# 히든 레이어의 가중치 행렬과 편향 벡터 생성
W1 = np.random.rand( NUMBER_HERE, NUMBER_HERE )  # 예를 들어, 랜덤 값으로 초기화
b1 = np.random.rand( NUMBER_HERE, NUMBER_HERE )  # 예를 들어, 랜덤 값으로 초기화

# 히든 레이어의 출력 계산
h1 = CODE_HERE       # h1 = W1 * x + b1
print(f"h1 shape: {h1.shape}")

# 출력 레이어의 가중치 행렬과 편향 벡터 생성
W2 = np.random.rand( NUMBER_HERE, NUMBER_HERE )  # 예를 들어, 랜덤 값으로 초기화
b2 = np.random.rand( NUMBER_HERE, NUMBER_HERE )  # 예를 들어, 랜덤 값으로 초기화

# 출력 레이어의 출력 계산
y =  CODE_HERE       # y = W2 * h1 + b2

# 출력 값 출력
print(f"y shape: {y.shape}")