# 1. 텐서의 기본 개념 및 생성 (1)
### Tensor란 무엇인가
Tensor는 data를 다차원 배열로 일반화한 것입니다. 수학적으로는 scalar, vector, matrix을 고차원으로 확장한 개념으로 볼 수 있으며, 딥러닝에서는 이러한 Tensor를 사용하여 복잡한 data 구조를 효율적으로 처리합니다. \
예를 들어, 0차원 Tensor는 단일 숫자(scalar)를, 1차원 Tensor는 숫자의 배열(vector)를, 2차원 Tensor는 숫자의 2차원 배열(matrix)을 나타내며, 이를 더 확장하여 Image Data(3차원 Tensor) or Video Data(4차원 Tensor) 등을 처리할 수 있습니다.
### Tensor의 중요성
Tensor는 Deeplearning model에서 data를 표현하고 처리하는 핵심적인 구성 요소입니다. 모든 Deeplearning 연산은 Tensor를 사용하여 수행되며, 이는 복잡한 Data Structurer를 효율적으로 다루기 위해 필수적입니다. Tensor를 사용함으로써 다음과 같은 이점을 얻을 수 있습니다
- 다차원 데이터 처리: Tensor를 사용하면 image, video, text 등 다양한 형태의 고차원 data를 쉽게 처리할 수 있습니다.
- 벡터화 연산: Tensor를 통한 벡터롸 연산은 계산 효율성을 높이고, 코드의 간결성을 유지할 수 있게 해줍니다.
- GPU 가속: 대부분의 Deeplearning Library는 Tensor 연산을 GPU에서 실행할 수 있게 지원하여, 대규모 dataset의 처리 속도를 크게 향상시킵니다. 
### PyTorch에서의 Tensor
PyTorch는 Tensor를 기반으로 Deeplearning model을 구축하고 학습합니다. PyTorch에서 Tensor는 torch.Tensor 클래스로 표현됩니다. 또한 동적 계산 그래프를 지원하여, 연산 과정이 Runtime에 결정되고 수정될 수 있게 해줍니다.
## 1.1. 리스트 데이터로 텐서 생성하기


In [1]:
import torch

ls = [1, 2, 3, 4, 5]
tensor1 = torch.tensor(ls)

print(tensor1)

tensor([1, 2, 3, 4, 5])


## 1.2. 넘파이 배열로 Tensor 생성하기

In [2]:
import numpy as np

numpy_array = np.array([1.5, 2.5, 3.5])
tensor2 = torch.tensor(numpy_array)

print(tensor2)

tensor([1.5000, 2.5000, 3.5000], dtype=torch.float64)


# 2. Data Type
### Tensor의 Type
Tensor의 Type(data type)은 Tensor가 저장하고 있는 data의 종류를 정의합니다. PyTorch에서는 다양한 data type을 지원하여, 다양한 종류의 data와 연산의 정밀도 요구사항을 충족시킵니다. data type은 Tensor의 각 요소가 차지하는 memory의 크기와 표현할 수 있는 값의 범위를 결정합니다. 
## 2.1. Integer Types
- torch.int8: 부호 없는 8비트 정수
- torch.unit8: 부호 없는 8비트 정수
- torch.int16 or torch.short: 16비트 정수
- torch.int64 or torch.long: 64비트 정수

In [3]:
# 정수형 텐서 생성
int_tensor = torch.tensor([1, 2, 3, 4])

print("정수형 텐서 값: ", int_tensor)
print("텐서의 타입: ", int_tensor.dtype)

정수형 텐서 값:  tensor([1, 2, 3, 4])
텐서의 타입:  torch.int64


## 2.2. Floating Point Types
- torch.float16 or torch.half: 16비트 반정밀도 부동 소수점
- torch.float32 or torch.float: 32비트 단정밀도 부동 소수점
- torch.float64 or torch.double: 64비트 배정밀도 부동 소수점
- torch.complex64: 32 비트 부동 소수점을 사용하는 복소수
- torch.complex128 or torch.cdouble: 64비트 부동 소수점을 사용하는 복소수

In [4]:
# 부동 소수점형 텐서 생성
float_tensor = torch.tensor([1.0, 2.0, 3.0, 4.0])

print("실수형 텐서 값: ", float_tensor)
print("텐서의 타입: ", float_tensor.dtype)

실수형 텐서 값:  tensor([1., 2., 3., 4.])
텐서의 타입:  torch.float32


## 2.3. Bool Type Tensor 생성
- torch.bool: True or False

In [5]:
bool_tensor = torch.tensor([True, False, True])

print("불리언 텐서 값: ", bool_tensor)
print("텐서의 타입: ", bool_tensor.dtype)

불리언 텐서 값:  tensor([ True, False,  True])
텐서의 타입:  torch.bool


## 2.4. 지정된 Data Type으로 Tensor 생성

In [6]:
specified_float_tensor = torch.tensor([1, 2, 3, 4], dtype=torch.float32)

print("타입 변환한 텐서 값: ", specified_float_tensor)
print("텐서의 타입: ",specified_float_tensor.dtype)

타입 변환한 텐서 값:  tensor([1., 2., 3., 4.])
텐서의 타입:  torch.float32


## 2.5. Tensor의 Type 변경 (1)

In [7]:
# 초기 텐서 생성 (정수 타입)
tensor = torch.tensor([1, 2, 3, 4])

# 텐서 속성 변환
float_tensor = tensor.float()           # int -> float
int_tensor = float_tensor.int()         # float -> int
double_tensor = float_tensor.double()   # float -> double
bool_tensor = int_tensor.bool()         # int -> bool

print("처음 생성한 텐서: ", tensor.dtype)
print('float_tensor의 타입 확인: ', float_tensor.dtype)
print('int_tensor의 타입 확인: ', int_tensor.dtype)
print('double_tensor의 타입 확인: ', double_tensor.dtype)
print('bool_tensor의 타입 확인: ', bool_tensor.dtype)

처음 생성한 텐서:  torch.int64
float_tensor의 타입 확인:  torch.float32
int_tensor의 타입 확인:  torch.int32
double_tensor의 타입 확인:  torch.float64
bool_tensor의 타입 확인:  torch.bool


## 2.6. Tensor의 타입 변경 (2) - to 메소드

In [9]:
# 텐서 속성 변환
float_tensor2 = tensor.to(dtype=torch.float32)
int_tensor2 = float_tensor.to(dtype=torch.int32)
double_tensor2 = float_tensor.to(dtype=torch.float64)
bool_tensor2 = int_tensor.to(dtype=torch.bool)

print("처음 생성한 텐서: ", tensor.dtype)
print('float_tensor의 타입 확인: ', float_tensor2.dtype)
print('int_tensor의 타입 확인: ', int_tensor2.dtype)
print('double_tensor의 타입 확인: ', double_tensor2.dtype)
print('bool_tensor의 타입 확인: ', bool_tensor2.dtype)

처음 생성한 텐서:  torch.int64
float_tensor의 타입 확인:  torch.float32
int_tensor의 타입 확인:  torch.int32
double_tensor의 타입 확인:  torch.float64
bool_tensor의 타입 확인:  torch.bool


# 3. Dimension and Shape
### Dimension
Dimension은 Tensor가 가지는 axis(축)의 수를 의미합니다. 차원의 수는 Tensor 데이터의 복잡성을 나타내며, 이는 Tensor가 얼마나 많은 수준의 중첩된 배열 구조를 가지고 있는지를 나타냅니다.
- 0차원 Tensor: scalar(단일 숫자)
- 1차원 Tensor: vector(숫자의 배열)
- 2차원 Tensor: matrix(숫자의 2차원 배열)
- 3차원 이상의 Tensor: 다차원 배열을 의미합니다.
### Shape