# Stage 4. Tensor의 연산

# 1. 기본 연산
## 1.1. Tensor와 Scalar의 연산
PyTorch에서 Tensor와 Scalar(단일 숫자)간의 사칙연산은 지원됩니다. Tensor와 Scalar 사이의 덧셈 연산을 수행할 때, Scalar 값은 Tensor의 모든 요소에 대해 적용됩니다. \
\
연산 방법은 Python과 동일합니다.
- 덧셈: +
- 뺄셈: -
- 곱셈: *
- 나눗셈: /
- 제곱: **

In [1]:
import torch

tensor = torch.tensor([[1, 2], [3, 4]], dtype=torch.float32)

# Tensor와 Scalar의 덧셈
add_scalar = tensor + 1

# Tensor와 Scalar의 뺄셈
sub_scalar = tensor - 1

# Tensor와 Scalar의 곱셈
mul_scalar = tensor * 2

# Tensor와 Scalar의 나눗셈
div_scalar = tensor / 2

# Tensor와 Scalar의 제곱
pow_scalar = tensor ** 2

print('Scalar 덧셈: \n', add_scalar)
print('Scalar 뺄셈: \n', sub_scalar)
print('Scalar 곱셈: \n', mul_scalar)
print('Scalar 나눗셈: \n', div_scalar)
print('Scalar 제곱: \n', pow_scalar)

Scalar 덧셈: 
 tensor([[2., 3.],
        [4., 5.]])
Scalar 뺄셈: 
 tensor([[0., 1.],
        [2., 3.]])
Scalar 곱셈: 
 tensor([[2., 4.],
        [6., 8.]])
Scalar 나눗셈: 
 tensor([[0.5000, 1.0000],
        [1.5000, 2.0000]])
Scalar 제곱: 
 tensor([[ 1.,  4.],
        [ 9., 16.]])


## 1.2. 덧셈과 뺄셈
Tensor의 덧셈과 뺄셈 연산은 두 Tensor의 동일 위치에 있는 요소들 끼리 연산을 수행합니다.\
\
예를 들어, 두 개의 2x2 텐서 tensor_a와 tensor_b는 각각 [[1,2],[3,4]]와 [[5,6],[7,8]]의 값을 갖을 때, 이 둘의 연산은 아래와 같이 계산됩니다.
- 덧셈 결과: 각 요소를 더한 결과인 [[6,8],[10,12]]를 얻습니다. 이는 tensor_a의 각 요소에 tensor_b의 해당 요소를 더하여 계산된 결과입니다.
- 뺄셈 결과: tensor_a에서 tensor_b를 뺀 결과인 [[-4,-4],[-4,-4]]를 얻습니다. 이는 tensor_a의 각 요소에서 tensor_b의 해당 요소를 빼서 계산된 결과입니다. 

In [2]:
tensor_a = torch.tensor([[1,2], [3,4]])
tensor_b = torch.tensor([[5,6], [7,8]])

# Tensor 덧셈
add_result = tensor_a + tensor_b
# 또는 torch.add(tensor_a, tensor_b)를 사용할 수 있습니다.

# Tensor 뺄셈
sub_result = tensor_a - tensor_b
# 또는 torch.sub(tensor_a, tensor_b)를 사용할 수 있습니다.

print('덧셈 결과: \n', add_result)
print('뺄셈 결과: \n', sub_result)

덧셈 결과: 
 tensor([[ 6,  8],
        [10, 12]])
뺄셈 결과: 
 tensor([[-4, -4],
        [-4, -4]])


## 1.3. 곱셈과 나눗셈
요소별 곱셈과 나눗셈 연산도 마찬가지로 각 텐서의 동일한 위치에 있는 요소끼리 수행됩니다.\
\
예를 들어, tensor_a와 tensor_b는 각각 [2,3,4]와 [5,6,7]의 값을 갖는 Tensor입니다. 연산 결과는 다음과 같습니다.
- 요소별 곱셈 결과: 각 요소의 곱셈 결과인 [10, 18, 28]을 얻습니다.
- 요소별 나눗셈 결과: 각 요소를 나눈 결과인 [0.4, 0.5, 0.5714...]를 얻습니다.

In [3]:
# 두 Tensor 생성
tensor_a = torch.tensor([2, 3, 4], dtype=torch.float32)
tensor_b = torch.tensor([5, 6, 7], dtype=torch.float32)

# 요소별 곱셈
product = tensor_a * tensor_b
# 또는 torch.mul(tensor_a, tensor_b)를 사용할 수 있습니다.
print('요소별 곱셈: ', product)

# 요소별 나눗셈
division = tensor_a / tensor_b
# 또는 torch.div(tensor_a, tensor_b)를 사용할 수 있습니다.
print('요소별 나눗셈: ', division)

요소별 곱셈:  tensor([10., 18., 28.])
요소별 나눗셈:  tensor([0.4000, 0.5000, 0.5714])


## 1.4. Broadcasting 이해하기
Broadcasting을 통해 서로 다른 shape을 가진 Tensor들 간에도 수학 연산을 수행할 수 있게 됩니다. 이는 더 작은 Tensor가 큰 Tensor의 모양에 맞게 자동으로 확장(확대)되어 연산이 가능하게 만듭니다. \
\
Broadcasting이 작동하는 방법은 다음과 같은 규칙을 따릅니다.
1. 차원의 크기가 같거나, 하나의 차원이 1인 경우에만 Broadcasting이 가능합니다. 예를 들어, (5, 4) 모양의 Tensor와 (1, 4) 모양의 Tensor는 Broadcasting이 가능합니다. 여기서 (1, 4) 모양의 Tensor는 첫 번째 차원을 따라 5회 반복되어 (5, 4) 모양으로 확장됩니다.
2. Tensor의 차원 수가 다를 경우, 더 작은 차원을 가진 Tensor의 모양 앞에 1을 추가하여 차원의 수를 맞춥니다. 예를 들어, (5, 4) 모양의 Tensor와 (4,) 모양의 Tensor가 있을 때, 더 작은 Tensor는 (1, 4)로 간주됩니다. 그 후, 앞서 설명한 바와 같이 Broadcasting이 수행됩니다.
3. Broadcasting은 각 차원을 따라 반복함으로써 더 큰 모양의 Tensor에 맞추어 확장합니다. 이 과정은 실제 data 복사가 일어나지 않으며, 연산을 효율적으로 만들기 위한 가상의 확장으로 생각할 수 있습니다.

In [4]:
# 크기가 (1, 3)인 Tensor 생성
tensor_a = torch.tensor([[1, 2, 3]], dtype=torch.float32)  

# 크기가 (3,)인 Tensor 생성
tensor_b = torch.tensor([4, 5, 6], dtype=torch.float32)   

# tensor_a와 tensor_b의 요소별 덧셈 (Broadcasting 발생)
# tensor_b가 tensor_a의 모양에 맞게 확장되어 연산됨
result_add = tensor_a + tensor_b
print('요소별 덧셈 결과: \n', result_add)

요소별 덧셈 결과: 
 tensor([[5., 7., 9.]])


# 2. 비교 연산
## 2.1. 동등 비교
동등 비교는 두 Tensor 간의 요소별 동등성을 비교하는 데 사용하는 것입니다. \
\
동등비교를 위해 ==또는 torch.eq()를 사용합니다. 이 함수는 두 Tensor의 동일한 위치에 있는 요소가 같은지 여부를 검사하고, 결과를 Boolean Tensor로 반환합니다. 즉, 두 요소가 같으면 True, 다르면 False 값을 갖습니다. \
\
torch.eq() 함수의 사용법은 매우 간단합니다. 두 Tensor a와 b가 주어졌을 때, torch.eq(a, b)를 호출하여 두 Tensor 간의 요소별 동등 비교를 수행할 수 있습니다.

In [5]:
tensor_a = torch.tensor([1, 2, 3, 4, 5])
tensor_b = torch.tensor([1, 2, 0, 4, 5])

result = tensor_a == tensor_b
# torch.eq(tensor_a, tensor_b)를 사용할 수 있습니다.

print('동등 비교 결과: ', result)

동등 비교 결과:  tensor([ True,  True, False,  True,  True])


## 2.2. 대소 비교(1) - 크다/작다
PyTorch에서 Tensor 간의 대소 비교는 각 요소의 값을 비교하여 해당 조건이 참인지 거짓인지를 판단하는 연산입니다.\
\
대소 비교에는 아래와 같은 함수를 이용합니다.
- \>, torch.gt(a, b): a가 b보다 큰 경우 True를 반환합니다. (greater than)
- <, torch.lt(a, b): a가 b보다 작은 경우 True를 반환합니다. (less than)
- \>=, torch.ge(a, b): a가 b보다 크거나 같은 경우 True를 반환합니다. (greater than or equal to)
- <=, torch.le(a, b): a가 b보다 작거나 같은 경우 True를 반환합니다. (less than or equal to)

In [6]:
tensor_a = torch.tensor([5, 6, 7, 8])
tensor_b = torch.tensor([4, 6, 7, 10])

# 조건: a 텐서가 b 텐서보다 크다
gt_result = tensor_a > tensor_b
# 또는 torch.gt(tensor_a, tensor_b)를 사용할 수 있습니다.

# 조건: a 텐서가 b 텐서보다 작다
lt_result = tensor_a < tensor_b
# 또는 torch.lt(tensor_a, tensor_b)를 사용할 수 있습니다.

print('a가 b보다 큰가: ', gt_result)
print('a가 b보다 작은가: ', lt_result)

a가 b보다 큰가:  tensor([ True, False, False, False])
a가 b보다 작은가:  tensor([False, False, False,  True])


## 2.3. 대소 비교(2) - 같거나 크다/작다

In [7]:
# Tensor 간 요소별 대소 비교 (a >= b)
ge_result = tensor_a >= tensor_b
# 또는 torch.ge(tensor_a, tensor_b)를 사용할 수 있습니다.

# Tensor 간 요소별 대소 비교 (a <= b)
le_result = tensor_a <= tensor_b
# 또는 torch.le(tensor_a, tensor_b)를 사용할 수 있습니다.

print('a가 b보다 크거나 같은가: ', ge_result)
print('a가 b보다 작거나 같은가: ', le_result)

a가 b보다 크거나 같은가:  tensor([ True,  True,  True, False])
a가 b보다 작거나 같은가:  tensor([False,  True,  True,  True])


## 2.4. 조건을 만족하는 요소 선택하기
대소 비교 연산을 통해 생성된 Boolean Tensor(mask)를 사용하여 조건을 만족하는 data를 추출할 수 있어요. 이 방법은 data filtering, 선별적 연산 수행 등 다양한 상황에서 활용될 수 있습니다.

In [8]:
# 두 Tensor 생성
A = torch.tensor([1, 4, 3, 2, 5])
B = torch.tensor([3, 2, 1, 5, 4])

# A의 각 요소가 B의 해당 요소보다 큰지 비교
mask = torch.gt(A, B)
# 또는 mask = A > B 를 사용할 수 있습니다.

# 조건을 만족하는 A의 요소 선택
selected_elements = A[mask]

print('조건을 만족하는 A의 요소: ', selected_elements)

조건을 만족하는 A의 요소:  tensor([4, 3, 5])


# 3. 축소 연산
## 3.1. 최대값/최소값 구하기
- 최대값: Tenosr 내의 최대값을 구하기 위해 torch.max()함수를 사용합니다. 이 함수는 Tensor 전체의 최대값을 반환할 수도 있고, 특정 차원을 기준으로 각 부분의 최대값과 그 indices(위치)를 반환할 수도 있습니다.
- 최소값: Tensor 내의 최소값을 구하기 위해 torch.min()함수를 사용합니다. 마찬가지로, Tenosr 전체의 최소값을 단일 값으로 반환하거나, 특정 차원에 따른 최소값과 해당 위치를 반환할 수 있습니다.

함수에 dim 매개변수를 지정함으로써, 특정 차원을 기준으로 한 최대값 최소값을 계산할 수 있습니다.

In [9]:
tensor = torch.tensor([[1, 2, 3], [4, 5, 6], [7, 8, 9]])

# 전체 Tenosr에서 최대값 구하기
max_value = torch.max(tensor)
print('전체 Tensor의 최대값: ', max_value)

# 전체 Tensor에서 최소값 구하기
min_value = torch.min(tensor)
print('전체 Tensor의 최소값: ', min_value)

# 특정 차원을 기준으로 최대값과 그 위치 구하기
max_values, max_indices = torch.max(tensor, dim=1)
print('각 행의 최대값: ', max_values)
print('각 행의 최대값 위치: ', max_indices)

# 특정 차원을 기준으로 최소값과 그 위치 구하기
min_values, min_indices = torch.min(tensor, dim=1)
print('각 행의 최소값: ', min_values)
print('각 행의 최소값 위치: ', min_indices)

전체 Tensor의 최대값:  tensor(9)
전체 Tensor의 최소값:  tensor(1)
각 행의 최대값:  tensor([3, 6, 9])
각 행의 최대값 위치:  tensor([2, 2, 2])
각 행의 최소값:  tensor([1, 4, 7])
각 행의 최소값 위치:  tensor([0, 0, 0])


## 3.2. 합계
Tensor 전체 요소의 합계를 구하기 위해 torch.sum()함수를 사용합니다. 이 함수는 Tensor 내 모든 요소의 합을 반환합니다.\
\
torch.sum()함수에 dim 매개변수를 지정함으로써, 특정 차원을 기준으로 한 합계를 계산할 수 있습니다. 예를 들어, 행 또는 열의 합계를 구할 수 있습니다.

In [10]:
tensor = torch.tensor([[1, 2, 3], [4, 5, 6], [7, 8, 9]])

# 전체 Tensor의 합계 구하기
total_sum = torch.sum(tensor)
print('Tensor 전체의 합계: ', total_sum)

# 각 열의 합계 구하기 (열 방향)
col_sum = torch.sum(tensor, dim=0)
print('각 열의 합계: ', col_sum)

# 각 행의 합계 구하기 (행 방향)
row_sum = torch.sum(tensor, dim=1)
print('각 행의 합계: ', row_sum)

Tensor 전체의 합계:  tensor(45)
각 열의 합계:  tensor([12, 15, 18])
각 행의 합계:  tensor([ 6, 15, 24])


## 3.3 평균/중앙값/최빈값
- 평균: data 집합의 총합을 data의 개수로 나눈 값입니다. torch.mean()함수를 사용하여 Tensor의 평균을 구할 수 있습니다. 이 함수는 부동 수소점 type의 Tensor에 대해서만 작동하므로, 정수 type tensor의 평균을 구하려면 type 변환을 해야 합니다.

- 중앙값: data를 크기 순으로 나열했을 때 중앙에 위치하는 값입니다. torch.median()함수를 사용하여 Tensor의 중앙값을 구할 수 있습니다.

- 최빈값: data 집합에서 가장 자주 등장하는 값을 의미합니다. torch.mode()함수를 사용하여 Tensor의 최빈값과 그 index를 구할 수 있습니다.